Ajouter des documents de type texte
Ajouter des documents de type texte
Téléversez en lot des documents de type texte, qui seront traités séquentiellement par découpage/segmentation, embedding/vectorisation, puis stockage afin d'obtenir de nouveaux identifiants de documents.
Remarque :
Le modèle d'embedding utilise le modèle par défaut et ne peut pas être défini via l'API.
Seuls les résultats du téléversement sont renvoyés, et non les résultats finaux de l'embedding. Vous pouvez obtenir les résultats finaux via l'API "Interroger le statut du document".
Méthode de requête
POST
URL de la requête
https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add
Authentification de la requête
Voir la section Présentation pour les détails d'authentification.
Requête
Exemple de requête
curl -X POST 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 700,
"splitter": "\n",
"files": [
{
"file_url": "https://www.gptbots.ai/fr_FR/docs/article_1.pdf",
"file_base64": "SGVsbG8sIEJhc2U2NCBFbmNvZGluZyE=",
"source_url": "https://www.gptbots.ai/fr_FR/docs/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
curl -X POST 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/add' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 700,
"splitter": "\n",
"files": [
{
"file_url": "https://www.gptbots.ai/fr_FR/docs/article_1.pdf",
"file_base64": "SGVsbG8sIEJhc2U2NCBFbmNvZGluZyE=",
"source_url": "https://www.gptbots.ai/fr_FR/docs/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
Ce bloc de code dans la fenêtre flottante
En-tête de la requête
| Champ | Type | Description |
|---|---|---|
| Authorization | Bearer ${API Key} | Utilisez Authorization: Bearer ${API Key} pour l'authentification. Obtenez la clé API depuis la page Clé API. |
| Content-Type | application/json | Type de données, à définir sur application/json. |
Paramètres de la requête
| Champ | Type | Obligatoire | Description |
|---|---|---|---|
| knowledge_base_id | String | Non | La base de connaissances cible à laquelle le document est ajouté. Si non renseigné, la base "Par défaut" est utilisée. |
| files | Array<Object> | Oui | Liste des documents à ajouter. Prend en charge l'ajout de jusqu'à 20 documents simultanément. |
| file_url | String | Non | URL du document à ajouter. Formats pris en charge : pdf/txt/md/doc/docx. Taille maximale pour PDF : 30 Mo, autres formats : 10 Mo. Remarque : soit l'URL, soit le base64 doit être fourni. Si les deux sont fournis, le base64 est prioritaire. |
| file_base64 | String | Non | Encodage base64 du document à ajouter. Formats pris en charge : pdf/txt/md/doc/docx. Taille maximale pour PDF : 30 Mo, autres formats : 10 Mo. Remarque : soit l'URL, soit le base64 doit être fourni. Si les deux sont fournis, le base64 est prioritaire. |
| file_name | String | Oui | Nom du document à ajouter. 1 à 200 caractères. |
| source_url | String | Non | URL source du document à ajouter. Doit respecter les spécifications de format d'URL. |
| chunk_token | Integer | Non | Nombre maximal de tokens par segment lors de la découpe. Valeur par défaut : 600. Plage valide : 1-1000. Remarque : soit chunk_token, soit splitter doit être spécifié. Une erreur se produira si aucun n'est fourni. Si les deux sont spécifiés, le splitter est prioritaire. |
| splitter | String | Non | Délimiteur utilisé pour la segmentation du texte. Par défaut : vide. Peut utiliser une "chaîne personnalisée" comme séparateur. Remarque : soit chunk_token, soit splitter doit être spécifié. Une erreur se produira si aucun n'est fourni. Si les deux sont spécifiés, le splitter est prioritaire. |
Réponse
Exemple de réponse
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"file_1",
"file_2"
]
}
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"file_1",
"file_2"
]
}
Ce bloc de code dans la fenêtre flottante
Réponse en cas de succès
| Champ | Type | Description |
|---|---|---|
| doc | Array<Object> | Liste des documents ajoutés. |
| doc_id | String | ID du document ajouté. |
| doc_name | String | Nom du document ajouté. |
| failed | Array<Object> | Liste des noms de documents dont l'ajout a échoué. |
Réponse en cas d'échec
| Champ | Type | Description |
|---|---|---|
| code | Int | Code d'erreur. |
| message | String | Détails de l'erreur. |
