Actualizar documentos de tipo hoja de cálculo

Se pueden actualizar por lotes documentos de tipo hoja de cálculo. El sistema realiza de forma secuencial la fragmentación, la generación de embeddings (vectorización) y, por último, sustituye el contenido del documento antiguo por el nuevo, manteniendo el ID del documento sin cambios.

Nota:
El modelo de embeddings utiliza el modelo predeterminado y no se puede definir dentro de la API.
Solo se devuelven los resultados de la carga, no los resultados finales de embeddings. Los resultados finales se pueden obtener mediante la API «Consultar el estado del documento» (Query Document Status).

Método de la solicitud

PUT

URL de la solicitud

https://api-${endpoint}.gptbots.ai/v1/bot/doc/spreadsheet/update

Autenticación de la solicitud

Consulte la sección «Visión general» para obtener información detallada sobre la autenticación.

Solicitud

Ejemplo de solicitud

curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/spreadsheet/update' \ -H 'Authorization: Bearer ${API Key}' \ -H 'Content-Type: application/json' \ -d '{ "knowledge_base_id": "67457fea6f658672d6482542", "chunk_token": 700, "header_row": 5, "files": [ { "doc_id": "xxxxxx", "file_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx", "source_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx", "file_name": "spreadsheet_1.xlsx" } ] }'

                      
                      curl -X PUT 'https://api-${endpoint}.gptbots.ai/v1/bot/doc/spreadsheet/update' \
-H 'Authorization: Bearer ${API Key}' \
-H 'Content-Type: application/json' \
-d '{
    "knowledge_base_id": "67457fea6f658672d6482542",
    "chunk_token": 700,
    "header_row": 5,
    "files": [
        {
            "doc_id": "xxxxxx",
            "file_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx",
            "source_url": "https://www.gptbots.ai/doc/spreadsheet.xlsx",
            "file_name": "spreadsheet_1.xlsx"
        }
    ]
}'

Este bloque de código en una ventana flotante

Cabecera de la solicitud

Campo	Tipo	Descripción
Authorization	`Bearer ${API Key}`	Se utiliza `Authorization: Bearer ${API Key}` para la autenticación. La clave de API se obtiene en la página «API Key».
Content-Type	application/json	Tipo de datos, con el valor `application/json`.

Parámetros de la solicitud

Campo	Tipo	Obligatorio	Descripción
knowledge_base_id	String	No	Base de conocimiento de destino en la que se actualiza el documento. Si no se rellena, se utiliza la base de conocimientos «Default».
files	Array	Sí	Lista de documentos que se van a actualizar. Permite actualizar hasta 20 documentos simultáneamente.
doc_id	String	Sí	ID del documento.
file_url	String	No	URL del documento. Formatos compatibles: csv/xls/xlsx. El tamaño máximo por documento es de 10 MB. Nota: Se debe proporcionar la URL o el valor en base64. Si se proporcionan ambos, base64 tiene prioridad.
file_base64	String	No	Valor en base64 del documento. Formatos compatibles: csv/xls/xlsx. El tamaño máximo por documento es de 10 MB. Nota: Se debe proporcionar la URL o el valor en base64. Si se proporcionan ambos, base64 tiene prioridad.
file_name	String	No	Nombre del archivo.
source_url	String	No	URL de origen del documento. Debe cumplir las especificaciones de formato de URL. Si está vacío, el sistema no actualizará este valor. Para establecer este valor como vacío, introducir `NULL`.
chunk_token	Integer	No	Número máximo de tokens por fragmento de conocimiento durante la fragmentación. El valor predeterminado es 600. Rango: 1-1000.
header_row	Integer	No	Número de filas de encabezado (máximo) que se tendrán en cuenta. Los documentos de tabla se fragmentan en función de «encabezado + filas de datos». El valor predeterminado es 1. Rango: 1-5.

Respuesta

Ejemplo de respuesta

{ "doc": [ { "doc_id": "xxxxxx", "doc_name": "test_1.csv" }, { "doc_id": "xxxxxx", "doc_name": "test_2.xlsx" } ], "failed": [ "xxxxxx", "xxxxxx" ] }

                      
                      {
    "doc": [
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_1.csv"
        },
        {
            "doc_id": "xxxxxx",
            "doc_name": "test_2.xlsx"
        }
    ],
    "failed": [
        "xxxxxx",
        "xxxxxx"
    ]
}

Este bloque de código en una ventana flotante

Respuesta de éxito

Campo	Tipo	Descripción
doc	Array	Lista de documentos que se van a actualizar.
doc_id	String	ID del documento que se va a actualizar.
doc_name	String	Nombre del documento que se va a actualizar (nombre del archivo).
failed	Array	Lista de ID de documentos cuya actualización ha fallado.

Respuesta de error

Campo	Tipo	Descripción
code	Int	Código de error.
message	String	Detalles del error.