Mettre à jour les documents texte
Mettre à jour les documents texte
Mettez à jour par lot des documents de type texte. Le système effectuera successivement le découpage ou le fractionnement, l'embedding/vectorisation, puis remplacera l'ancien contenu du document par le nouveau, tout en conservant l'ID du document inchangé.
Remarque :
Le modèle d'embedding utilise le modèle par défaut et ne peut pas être défini via l'API.
Seuls les résultats du téléchargement sont retournés, et non les résultats finaux de l'embedding. Vous pouvez obtenir les résultats finaux via l'API "Interroger le statut du document".
Méthode de requête
PUT
URL de la requête
https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update
Authentification de la requête
Voir la section Présentation pour les détails d'authentification.
Requête
Exemple de requête
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/text/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 600,
"splitter": "\n",
"files": [
{
"doc_id": "675158a5af12af632a4f63f6",
"file_url": "https://www.gptbots.ai/doc/article_1.pdf",
"source_url": "https://www.gptbots.ai/doc/article_1.pdf",
"file_name": "article_1.pdf"
}
]
}'
Ce bloc de code dans la fenêtre flottante
En-têtes de la requête
| Champ | Type | Description |
|---|---|---|
| Authorization | Bearer ${API Key} | Utilisez Authorization: Bearer ${API Key} pour l'authentification. Obtenez la clé API sur la page Clé API. |
| Content-Type | application/json | Type de données, à définir sur application/json. |
Paramètres de la requête
| Champ | Type | Obligatoire | Description |
|---|---|---|---|
| files | Array<Object> | Oui | Liste des documents à mettre à jour. Prend en charge la mise à jour de jusqu'à 200 documents simultanément. |
| doc_id | String | Oui | L'ID du document à mettre à jour. |
| file_url | String | Non | L'URL du document à mettre à jour. Formats pris en charge : pdf/txt/md/doc/docx. Taille maximale pour les PDF : 30 Mo, pour les autres formats : 10 Mo. Remarque : l'URL ou le base64 doit être fourni. Si les deux sont fournis, le base64 prévaut. |
| file_base64 | String | Non | Le base64 du document à mettre à jour. Formats pris en charge : pdf/txt/md/doc/docx. Taille maximale pour les PDF : 30 Mo, pour les autres formats : 10 Mo. Remarque : l'URL ou le base64 doit être fourni. Si les deux sont fournis, le base64 prévaut. |
| source_url | String | Non | L'URL source du document à mettre à jour. Doit respecter les spécifications de format d'URL. Si vide, le système ne mettra pas à jour cette valeur. Pour définir cette valeur à vide, veuillez saisir NULL. |
| chunk_token | Integer | Non | Nombre maximal de tokens pour un fragment de connaissance lors du découpage. Valeur par défaut : 600. Plage : 1-1000. Remarque : le nombre maximal de tokens ou le séparateur doit être fourni. Si les deux sont fournis, le séparateur prévaut. |
| splitter | String | Non | Le séparateur utilisé lors du découpage. Par défaut, vide. Vous pouvez utiliser "\n" comme séparateur de saut de ligne. Remarque : le nombre maximal de tokens ou le séparateur doit être fourni. Si les deux sont fournis, le séparateur prévaut. |
Réponse
Exemple de réponse
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.txt"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.pdf"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
Ce bloc de code dans la fenêtre flottante
Réponse en cas de succès
| Champ | Type | Description |
|---|---|---|
| doc | Array<Object> | Liste des documents à mettre à jour. |
| doc_id | String | ID du document à mettre à jour. |
| doc_name | String | Nom du document à mettre à jour. |
| failed | Array<Object> | Liste des ID des documents non mis à jour. |
Réponse en cas d'échec
| Champ | Type | Description |
|---|---|---|
| code | Int | Code d'erreur. |
| message | String | Détails de l'erreur. |
