Textdokumente aktualisieren

Mehrere Textdokumente im Batch aktualisieren. Das System führt nacheinander das Chunking oder Slicing, das Embedding/Vektorisieren und schließlich den Austausch des alten durch den neuen Dokumenteninhalt durch – die Dokumenten-ID bleibt dabei unverändert.

Hinweis:
Das Embedding-Modell nutzt standardmäßig das Standardmodell und kann nicht per API festgelegt werden.
Nur die Upload-Ergebnisse werden zurückgegeben, nicht die endgültigen Embedding-Ergebnisse. Den endgültigen Status erhalten Sie über die API „Dokumentenstatus abfragen“.

Anfragemethode

PUT

Anfrage-URL

https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update

Authentifizierung der Anfrage

Details zur Authentifizierung finden Sie im Abschnitt Übersicht.

Anfrage

Beispielanfrage

curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \ -H 'Authorization: Bearer ${API Key}' \ -H 'Content-Type: application/json' \ -d '{ "knowledge_base_id": "67457fea6f658672d6482542", "chunk_token": 600, "splitter": "\n", "files": [ { "doc_id": "675158a5af12af632a4f63f6", "file_url": "https://www.gptbots.ai/doc/article_1.pdf", "source_url": "https://www.gptbots.ai/doc/article_1.pdf", "file_name": "article_1.pdf" } ] }'

                      
                      curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
    "knowledge_base_id": "67457fea6f658672d6482542",
    "chunk_token": 600,
    "splitter": "\n",
    "files": [
        {
            "doc_id": "675158a5af12af632a4f63f6",
            "file_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "source_url": "https://www.gptbots.ai/doc/article_1.pdf",
            "file_name": "article_1.pdf"
        }
    ]
}'

Dieser Codeblock im schwebenden Fenster

Anfrage-Header

Feld	Typ	Beschreibung
Authorization	Bearer ${API Key}	Für die Authentifizierung verwenden Sie Authorization: Bearer ${API Key}. Den API Key erhalten Sie auf der API-Key-Seite.
Content-Type	application/json	Datentyp, auf `application/json` setzen.

Anfrageparameter

Feld	Typ	Erforderlich	Beschreibung
files	Array<Object>	Ja	Liste der zu aktualisierenden Dokumente. Unterstützt das gleichzeitige Aktualisieren von bis zu 200 Dokumenten.
doc_id	String	Ja	Die ID des zu aktualisierenden Dokuments.
file_url	String	Nein	Die URL des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang.
file_base64	String	Nein	Base64-kodierte Datei des zu aktualisierenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Größe für PDF-Dokumente: 30 MB, für andere Formate: 10 MB. Hinweis: Entweder URL oder base64 muss angegeben werden. Wenn beides angegeben ist, hat base64 Vorrang.
source_url	String	Nein	Die Quell-URL des zu aktualisierenden Dokuments. Muss den URL-Formatvorgaben entsprechen. Wenn leer, wird dieser Wert nicht aktualisiert. Um diesen Wert zu leeren, bitte `NULL` eingeben.
chunk_token	Integer	Nein	Maximale Token-Anzahl für einen Wissens-Chunk beim Chunking. Standardwert: 600. Bereich: 1–1.000. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang.
splitter	String	Nein	Das beim Chunking verwendete Trennzeichen. Standard ist leer. Sie können „\n“ als Zeilenumbruch-Trennzeichen verwenden. Hinweis: Entweder maximale Token-Anzahl oder Splitter muss angegeben werden. Wenn beides angegeben ist, hat Splitter Vorrang.

Antwort

Beispielantwort

{ "doc": [ { "doc_id": "xxxxxx", "doc_name": "test_1.txt" }, { "doc_id": "xxxxxx", "doc_name": "test_2.pdf" } ], "failed": [ "xxxxxx", "xxxxxx" ] }

                      
                      {
    "doc": [
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_1.txt"
        },
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_2.pdf"
        }
    ],
    "failed": [
        "xxxxxx",
        "xxxxxx"
    ]
}

Dieser Codeblock im schwebenden Fenster

Erfolgsantwort

Feld	Typ	Beschreibung
doc	Array<Object>	Liste der aktualisierten Dokumente.
doc_id	String	ID des aktualisierten Dokuments.
doc_name	String	Name des aktualisierten Dokuments.
failed	Array<Object>	Liste der IDs der Dokumente, die nicht aktualisiert werden konnten.

Fehlerantwort

Feld	Typ	Beschreibung
code	Int	Fehlercode.
message	String	Fehlerdetails.