添加数据
最新更新:2024-09-20
添加数据
在数据表创建完成后,您可以为该数据表添加数据。添加的数据可以是结构化数据,也可以是非结构化数据。可以根据企业的数据类型,选择不同的添加方式。
非结构化数据
GPTBots 支持通过 LLM 对非结构化数据(如 PDF、Word、Excel、TXT 等)文档进行实体抽取,将结构化数据导入数据库,实现数据的快速入库和管理。具体的添加方式如下:
- 点击「添加数据」按钮,进入数据添加页面。
- 选择「本地文档」或「Google drive」方式,选择需要导入的非结构化数据文件,支持的文件类型包括 PDF、Word、Excel、TXT 等。每个文件的tokens 上限为 10K,超出部分的内容将被截断处理。
- 点击「下一步」进入文档实体抽取页面,展示「识别服务、数据抽取方式和抽取字段名称」等信息。
- 识别服务:当上传的知识文档存在 PDF 格式时,可选择使用 「普通识别或高级识别」对 PDF 文件进行解析。两者的区别在于,普通识别服务的解析速度更快,不消耗积分。而高级识别服务的解析质量较高速度较慢,消耗更多积分。
- 数据抽取方式:GPTBots 支持两种数据抽取方式,“每份文档只抽取一条数据”是指每份文档只抽取1条该数据表的字段值,“每份文档抽取多条数据”是指每份文档可抽取多条该数据表的字段值。
- 抽取字段名称:此处显示该数据表的所有字段名称,是要抽取的对象字段。
- 点击「保存」按钮,即可完成数据的添加工作,所提交的文档开始进入任务队列,等待处理完成即可将抽取到的数据添加到数据表中。在「当前任务」中可以查看任务的状态进度、和积分消耗情况。
结构化数据
模板导入
当数据表的字段创建完成后,您可以通过模板导入的方式,快速将结构化数据添加到数据库中。具体的添加方式如下:
- 在数据表页面点击「添加数据」按钮,进入数据添加页面。
- 选择「模板导入」方式,可下载模板.csv文件按照格式填充数据后,可以选择模板 CVS 文件进行上传。
- 点击「下一步」进入数据导入页面,点击「保存」按钮,即可完成数据的添加工作。
- 模板文件中数据解析和导入任务完成后,您可以在数据表页面查看添加的数据。
API 添加
当数据表的字段创建完成后,您可以通过 API 接口的方式,将结构化数据添加到数据库中。
即将支持...