Actualizar documentos de tipo hoja de cálculo
Se pueden actualizar por lotes documentos de tipo hoja de cálculo. El sistema realiza de forma secuencial la fragmentación, la generación de embeddings (vectorización) y, por último, sustituye el contenido del documento antiguo por el nuevo, manteniendo el ID del documento sin cambios.
Nota:
El modelo de embeddings utiliza el modelo predeterminado y no se puede definir dentro de la API.
Solo se devuelven los resultados de la carga, no los resultados finales de embeddings. Los resultados finales se pueden obtener mediante la API «Consultar el estado del documento» (Query Document Status).
Método de la solicitud
PUT
URL de la solicitud
https://api-${endpoint}.gptbots.ai/v1/bot/doc/spreadsheet/update
Autenticación de la solicitud
Consulte la sección «Visión general» para obtener información detallada sobre la autenticación.
Solicitud
Ejemplo de solicitud
curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/spreadsheet/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
"knowledge_base_id": "67457fea6f658672d6482542",
"chunk_token": 700,
"header_row": 5,
"files": [
{
"doc_id": "xxxxxx",
"file_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx",
"source_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx",
"file_name": "spreadsheet_1.xlsx"
}
]
}'
Cabecera de la solicitud
| Campo | Tipo | Descripción |
|---|---|---|
| Authorization | Bearer ${API Key} |
Se utiliza Authorization: Bearer ${API Key} para la autenticación. La clave de API se obtiene en la página «API Key». |
| Content-Type | application/json | Tipo de datos, con el valor application/json. |
Parámetros de la solicitud
| Campo | Tipo | Obligatorio | Descripción |
|---|---|---|---|
| knowledge_base_id | String | No | Base de conocimiento de destino en la que se actualiza el documento. Si no se rellena, se utiliza la base de conocimientos «Default». |
| files | Array | Sí | Lista de documentos que se van a actualizar. Permite actualizar hasta 20 documentos simultáneamente. |
| doc_id | String | Sí | ID del documento. |
| file_url | String | No | URL del documento. Formatos compatibles: csv/xls/xlsx. El tamaño máximo por documento es de 10 MB. Nota: Se debe proporcionar la URL o el valor en base64. Si se proporcionan ambos, base64 tiene prioridad. |
| file_base64 | String | No | Valor en base64 del documento. Formatos compatibles: csv/xls/xlsx. El tamaño máximo por documento es de 10 MB. Nota: Se debe proporcionar la URL o el valor en base64. Si se proporcionan ambos, base64 tiene prioridad. |
| file_name | String | No | Nombre del archivo. |
| source_url | String | No | URL de origen del documento. Debe cumplir las especificaciones de formato de URL. Si está vacío, el sistema no actualizará este valor. Para establecer este valor como vacío, introducir NULL. |
| chunk_token | Integer | No | Número máximo de tokens por fragmento de conocimiento durante la fragmentación. El valor predeterminado es 600. Rango: 1-1000. |
| header_row | Integer | No | Número de filas de encabezado (máximo) que se tendrán en cuenta. Los documentos de tabla se fragmentan en función de «encabezado + filas de datos». El valor predeterminado es 1. Rango: 1-5. |
Respuesta
Ejemplo de respuesta
{
"doc": [
{
"doc_id": "xxxxxx",
"doc_name": "test_1.csv"
},
{
"doc_id": "xxxxxx",
"doc_name": "test_2.xlsx"
}
],
"failed": [
"xxxxxx",
"xxxxxx"
]
}
Respuesta de éxito
| Campo | Tipo | Descripción |
|---|---|---|
| doc | Array | Lista de documentos que se van a actualizar. |
| doc_id | String | ID del documento que se va a actualizar. |
| doc_name | String | Nombre del documento que se va a actualizar (nombre del archivo). |
| failed | Array |
Lista de ID de documentos cuya actualización ha fallado. |
Respuesta de error
| Campo | Tipo | Descripción |
|---|---|---|
| code | Int | Código de error. |
| message | String | Detalles del error. |
