文档
最新更新:2024-02-20

文档

添加

类型

image-20240220113337542

您可以添加多种类型的文档,使之成为 Bot 的知识。

  1. 文件:支持 .doc/.docx/.pdf/.md/.txt 等多种格式。
  2. 表格:支持 .xls/.xlsx/.csv 格式。
  3. URL:提供网站的 URL,系统将爬取网页内容作为 Bot 知识。
  4. TXT:直接在线输入内容作为知识。
  5. Q&A:以「Q&A(问答对,即一问一答)」为结构的知识类型。

切片

不同的文档类型,提供了不同的切片方式。您可以在页面中预览切片效果。

若您对切片不了解,建议使用系统默认值。

image-20240220114928210

对于文件、URL、TXT 类型,可以选择两种不同的切片方式:

  • 按 Token 数:基于设定的 Token 数进行切片。例如,设定为「1000」,则为文档按每 1000 Token 生成一个切片。
  • 按标识符:基于选定的标识符进行切片。例如,设定为「\n」,即换行符,则为文档按每次换行,生成一个切片。

image-20240220115152702

对于表格类型,可以选择多行行作为表头。系统将会基于「表头+行」的方式,对表格数据进行切片。

image-20240220115529387

对于 Q&A 类型,则不需要选择切片方式,系统将自动将每个 Q&A 作为一个切片。

从其他 Bot 复制

image-20240220115622742

您可以从同组织内的其他 Bot,复制它的文档到当前 Bot,成为该 Bot 的知识文档。

编辑

image-20240220120102019

对于已经添加的文档,可在线进行二次编辑。

表格类型的文档,暂不支持在线编辑。

URL 更新

image-20240220120905669

对于 URL 类型,可以进行更新,以获取网页最新的内容作为知识。

image-20240308160014438

若 Bot 内的 URL 文档太多,您也可以设置「定时更新」。Bot 会根据您设置的时间,定时为您全量更新所有 URL 文档内容。

image-20240308160041115

您可以选择按天、按周或按月,定时更新您的 URL 文档。