logo
Entwicklung
Suchen
Textdokumente hochladen

Textdokumente hochladen

Lade mehrere Textdokumente gleichzeitig im Stapel hoch. Die Dokumente werden nacheinander durch Segmentierung (Chunking/Slicing), Vektorisierung (Embedding) und Speicherung verarbeitet, sodass neue Dokument-IDs generiert werden.

Hinweis:
Das Embedding-Modell ist fest vorgegeben und kann nicht über die API ausgewählt werden.
Es werden nur die Upload-Ergebnisse zurückgegeben, nicht die abschließenden Vektorisierungsergebnisse. Diese können Sie über die API „Dokumentenstatus abfragen“ einsehen.

HTTP-Methode

POST

Anfrage-URL

https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add

Authentifizierung

Siehe Übersicht für Details zur Authentifizierung.

Anfrage

Beispielanfrage

curl -X POST 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add' \ -H 'Authorization: Bearer ${API Key}' \ -H 'Content-Type: application/json' \ -d '{ "knowledge_base_id": "67457fea6f658672d6482542", "chunk_token": 700, "splitter": "\n", "files": [ { "file_url": "https://www.gptbots.ai/docs/article_1.pdf", "file_base64": "SGVsbG8sIEJhc2U2NCBFbmNvZGluZyE=", "source_url": "https://www.gptbots.ai/docs/article_1.pdf", "file_name": "article_1.pdf" } ] }'
                      
                      curl -X POST 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
    "knowledge_base_id": "67457fea6f658672d6482542",
    "chunk_token": 700,
    "splitter": "\n",
    "files": [
        {
            "file_url": "https://www.gptbots.ai/docs/article_1.pdf",
            "file_base64": "SGVsbG8sIEJhc2U2NCBFbmNvZGluZyE=",
            "source_url": "https://www.gptbots.ai/docs/article_1.pdf",
            "file_name": "article_1.pdf"
        }
    ]
}'

                    
Dieser Codeblock im schwebenden Fenster

HTTP-Header

Feld Typ Beschreibung
Authorization Bearer ${API Key} Für die Authentifizierung verwenden Sie Authorization: Bearer ${API Key}. Den API Key erhalten Sie auf der API Key-Seite.
Content-Type application/json Datentyp, auf application/json setzen.

Anfrageparameter

Feld Typ Erforderlich Beschreibung
knowledge_base_id String Nein Die Ziel-Wissensdatenbank, zu der das Dokument hochgeladen wird. Wenn nicht angegeben, wird die „Standard“-Wissensdatenbank verwendet.
files Array<Object> Ja Liste der hochzuladenden Dokumente. Es können bis zu 20 Dokumente gleichzeitig hochgeladen werden.
file_url String Nein Die URL des hochzuladenden Dokuments. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Dateigröße: PDF bis zu 30 MB, andere Formate bis zu 10 MB. Hinweis: Entweder URL oder Base64 muss angegeben werden. Wenn beides vorhanden ist, hat Base64 Vorrang.
file_base64 String Nein Base64-kodiertes Dokument. Unterstützte Formate: pdf/txt/md/doc/docx. Maximale Dateigröße: PDF bis zu 30 MB, andere Formate bis zu 10 MB. Hinweis: Entweder URL oder Base64 muss angegeben werden. Wenn beides vorhanden ist, hat Base64 Vorrang.
file_name String Ja Name des hochzuladenden Dokuments. 1–200 Zeichen.
source_url String Nein Quell-URL des hochzuladenden Dokuments. Muss den URL-Formatvorgaben entsprechen.
chunk_token Integer Nein Maximale Anzahl an Tokens pro Wissens-Chunk bei der Segmentierung. Standardwert ist 600. Gültiger Bereich: 1–1000.
Hinweis: Entweder chunk_token oder splitter muss angegeben werden. Wenn keines angegeben ist, tritt ein Fehler auf. Wenn beides angegeben ist, hat der Splitter Vorrang.
splitter String Nein Trennzeichen für die Textsegmentierung. Standard ist leer. Sie können einen benutzerdefinierten String als Trennzeichen verwenden.
Hinweis: Entweder chunk_token oder splitter muss angegeben werden. Wenn keines angegeben ist, tritt ein Fehler auf. Wenn beides angegeben ist, hat der Splitter Vorrang.

Antwort

Beispielantwort

{ "doc": [ { "doc_id": "xxxxxx", "doc_name": "test_1.txt" }, { "doc_id": "xxxxxx", "doc_name": "test_2.pdf" } ], "failed": [ "file_1", "file_2" ] }
                      
                      {
    "doc": [
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_1.txt"
        },
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_2.pdf"
        }
    ],
    "failed": [
        "file_1",
        "file_2"
    ]
}

                    
Dieser Codeblock im schwebenden Fenster

Erfolgsantwort

Feld Typ Beschreibung
doc Array<Object> Liste der erfolgreich hinzugefügten Dokumente.
doc_id String ID des hinzugefügten Dokuments.
doc_name String Name des hinzugefügten Dokuments.
failed Array<Object> Liste der fehlgeschlagenen Dokumente.

Fehlerantwort

Feld Typ Beschreibung
code Int Fehlercode.
message String Fehlerdetails.