logo
Entwicklung
Suchen
Textdokumente aktualisieren

Textdokumente aktualisieren

Mehrere Textdokumente im Batch aktualisieren. Das System führt nacheinander das Chunking oder Slicing, das Embedding/Vektorisieren und schließlich den Austausch des alten durch den neuen Dokumenteninhalt durch – die Dokumenten-ID bleibt dabei unverändert.

Hinweis:
Das Embedding-Modell nutzt standardmäßig das Standardmodell und kann nicht per API festgelegt werden.
Nur die Upload-Ergebnisse werden zurückgegeben, nicht die endgültigen Embedding-Ergebnisse. Den endgültigen Status erhalten Sie über die API „Dokumentenstatus abfragen“.

Anfragemethode

PUT

Anfrage-URL

https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update

Authentifizierung der Anfrage

Details zur Authentifizierung finden Sie im Abschnitt Übersicht.

Anfrage

Beispielanfrage

curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \ -H 'Authorization: Bearer ${API Key}' \ -H 'Content-Type: application/json' \ -d '{ "knowledge_base_id": "67457fea6f658672d6482542", "chunk_token": 600, "splitter": "\n", "files": [ { "doc_id": "675158a5af12af632a4f63f6", "file_url": "https://www.gptbots.ai/doc/article_1.pdf", "source_url": "https://www.gptbots.ai/doc/article_1.pdf", "file_name": "article_1.pdf" } ] }'
                      
                      curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
    "knowledge_base_id": "67457fea6f658672d6482542",
    "chunk_token": 600,
    "splitter": "\n",
    "files": [
        {
            "doc_id": "675158a5af12af632a4f63f6",
            "file_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "source_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "file_name": "article_1.pdf"
        }
    ]
}'

                    
Dieser Codeblock im schwebenden Fenster

Anfrage-Header

Feld Typ Beschreibung
Authorization Bearer ${API Key} Für die Authentifizierung verwenden Sie Authorization: Bearer ${API Key}. Den API Key erhalten Sie auf der API-Key-Seite.
Content-Type application/json Datentyp, auf application/json setzen.

Anfrageparameter

Feld Typ Erforderlich Beschreibung
files Array<Object> Ja Liste der zu aktualisierenden Dokumente. Unterstützt das gleichzeitige Aktualisieren von bis zu 200 Dokumenten.
doc_id String Ja Die ID des zu aktualisierenden Dokuments.
file_url String Nein Die URL des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang.
file_base64 String Nein Base64-kodierte Datei des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang.
source_url String Nein Die Quell-URL des zu aktualisierenden Dokuments. Muss den URL-Formatvorgaben entsprechen. Wenn leer, wird dieser Wert nicht aktualisiert. Um diesen Wert zu leeren, bitte NULL eingeben.
chunk_token Integer Nein Maximale Token-Anzahl für einen Wissens-Chunk beim Chunking. Standardwert: 600. Bereich: 1–1.000. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang.
splitter String Nein Das beim Chunking verwendete Trennzeichen. Standard ist leer. Sie können „\n“ als Zeilenumbruch-Trennzeichen verwenden. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang.

Antwort

Beispielantwort

{ "doc": [ { "doc_id": "xxxxxx", "doc_name": "test_1.txt" }, { "doc_id": "xxxxxx", "doc_name": "test_2.pdf" } ], "failed": [ "xxxxxx", "xxxxxx" ] }
                      
                      {
    "doc": [
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_1.txt"
        },
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_2.pdf"
        }
    ],
    "failed": [
        "xxxxxx",
        "xxxxxx"
    ]
}

                    
Dieser Codeblock im schwebenden Fenster

Erfolgsantwort

Feld Typ Beschreibung
doc Array<Object> Liste der aktualisierten Dokumente.
doc_id String ID des aktualisierten Dokuments.
doc_name String Name des aktualisierten Dokuments.
failed Array<Object> Liste der IDs der Dokumente, die nicht aktualisiert werden konnten.

Fehlerantwort

Feld Typ Beschreibung
code Int Fehlercode.
message String Fehlerdetails.