Textdokumente aktualisieren
Textdokumente aktualisieren
Mehrere Textdokumente im Batch aktualisieren. Das System führt nacheinander das Chunking oder Slicing, das Embedding/Vektorisieren und schließlich den Austausch des alten durch den neuen Dokumenteninhalt durch – die Dokumenten-ID bleibt dabei unverändert.
Hinweis:
Das Embedding-Modell nutzt standardmäßig das Standardmodell und kann nicht per API festgelegt werden.
Nur die Upload-Ergebnisse werden zurückgegeben, nicht die endgültigen Embedding-Ergebnisse. Den endgültigen Status erhalten Sie über die API „Dokumentenstatus abfragen“.
Anfragemethode
PUT
Anfrage-URL
https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update
Authentifizierung der Anfrage
Details zur Authentifizierung finden Sie im Abschnitt Übersicht.
Anfrage
Beispielanfrage
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
Dieser Codeblock im schwebenden Fenster
Anfrage-Header
| Feld | Typ | Beschreibung |
|---|---|---|
| Authorization | Bearer ${API Key} | Für die Authentifizierung verwenden Sie Authorization: Bearer ${API Key}. Den API Key erhalten Sie auf der API-Key-Seite. |
| Content-Type | application/json | Datentyp, auf application/json setzen. |
Anfrageparameter
| Feld | Typ | Erforderlich | Beschreibung |
|---|---|---|---|
| files | Array<Object> | Ja | Liste der zu aktualisierenden Dokumente. Unterstützt das gleichzeitige Aktualisieren von bis zu 200 Dokumenten. |
| doc_id | String | Ja | Die ID des zu aktualisierenden Dokuments. |
| file_url | String | Nein | Die URL des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang. |
| file_base64 | String | Nein | Base64-kodierte Datei des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang. |
| source_url | String | Nein | Die Quell-URL des zu aktualisierenden Dokuments. Muss den URL-Formatvorgaben entsprechen. Wenn leer, wird dieser Wert nicht aktualisiert. Um diesen Wert zu leeren, bitte NULL eingeben. |
| chunk_token | Integer | Nein | Maximale Token-Anzahl für einen Wissens-Chunk beim Chunking. Standardwert: 600. Bereich: 1–1.000. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang. |
| splitter | String | Nein | Das beim Chunking verwendete Trennzeichen. Standard ist leer. Sie können „\n“ als Zeilenumbruch-Trennzeichen verwenden. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang. |
Antwort
Beispielantwort
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
Dieser Codeblock im schwebenden Fenster
Erfolgsantwort
| Feld | Typ | Beschreibung |
|---|---|---|
| doc | Array<Object> | Liste der aktualisierten Dokumente. |
| doc_id | String | ID des aktualisierten Dokuments. |
| doc_name | String | Name des aktualisierten Dokuments. |
| failed | Array<Object> | Liste der IDs der Dokumente, die nicht aktualisiert werden konnten. |
Fehlerantwort
| Feld | Typ | Beschreibung |
|---|---|---|
| code | Int | Fehlercode. |
| message | String | Fehlerdetails. |
