logo
开发者文档
搜索
元数据

元数据

元数据(Metadata)是为知识库文档附加的「结构化标签」,例如文档的来源、上传时间、所属部门、产品线、生效日期等。
为知识打上元数据后,您可以在检索时按元数据精准过滤——例如「只检索 2025 年之后、来源为官方手册的文档」,让 Agent 在更小、更相关的范围内召回知识,从而提升回答的准确性。

字段类型与作用范围

元数据在GPTBots中分为系统预置元数据全局元数据知识库元数据三大类。

  • 系统预置元数据:由系统自动记录,包含文档的基本信息;自定义字段则由用户创建,支持文本、数字、日期时间、列表等多种类型,用于满足不同的业务需求。
  • 全局元数据:属于自定义元数据,在知识库列表页配置,对组织内所有知识库生效,适合统一的全局标签(如「保密级别」「业务线」)。
  • 知识库元数据:属于自定义元数据,仅在某个知识库内配置,仅对该知识库生效,适合该库特有的字段。

系统预置元数据

文档被添加时,系统会自动记录一组预置元数据字段,无需您手动填写:

字段 含义
知识库名称 文档所属知识库的名称
文档名称 文档的名称
上传者 添加该文档的成员
上传者邮箱 添加者的邮箱
上传时间 文档首次添加的时间
最后更新时间 文档最近一次更新的时间
来源链接 文档的来源 URL(如通过 URL 添加)
来源 文档的添加方式(文件 / URL / 文本等)
数据存储类型 知识的存储结构(如 Q&A、表格、结构化、Markdown)
文档格式 文档的文件格式(如 pdf、docx、md)

预置字段不可重命名、不可删除、不可修改类型,仅可调整其在界面上的显示名称等展示属性。

全局元数据与知识库元数据

自定义创建的元数据字段分为两个作用范围,不同范围决定字段对哪些知识库生效。管理员可以根据业务需求选择合适的作用范围来创建字段:

loading...
graph TD
E[全局元数据] -->|对所有知识库生效| KB1[知识库 A]
E --> KB2[知识库 B]
E --> KB3[知识库 C]
G[知识库A元数据] -->|仅对当前知识库生效| KB1

管理元数据字段

alt text

  1. 进入知识库(企业级字段则在知识库列表页),点击【元数据】打开元数据管理面板。
  2. 点击【Add Field】新建字段,选择类型并填写字段名、显示名称、默认值等信息。
  3. 点击列表中的某个字段可进入编辑;预置字段仅可修改展示属性。
  4. 在字段编辑面板底部可【删除】自定义字段(预置字段不可删除)。

alt text
除系统预置的元数据字段外,您还可以创建自定义字段,用业务维度组织知识。自定义字段支持以下类型:

类型 说明 典型用途
文本(STRING) 任意字符串 部门、负责人、产品线
数字(NUMBER) 数值,支持比较与范围 版本号、优先级、年份
日期时间(DATETIME) 时间,支持「之前/之后/区间」 生效日期、过期日期
列表(LIST) 预设选项,单选/多选 标签、分类、状态

创建自定义元数据字段时最多可创建 50 个,可配置:

  • 字段名(name):用于检索与存储的标识,需符合命名规则(小写字母开头,由小写字母、数字、下划线组成,最长 32 个字符)。创建后不可修改。
  • 显示名称(displayLabel):界面上展示的名称,可修改。
  • 字段类型:见上表,创建后不可修改。
  • 选项(仅列表类型):可选值清单。
  • 默认值:新文档未填写时自动填充的值。
  • 描述:字段说明,最长 50 字符。

为文档设置元数据值

系统字段由系统自动填充。对于自定义字段,您可以在文档详情页为每个文档填写或修改对应的元数据值;若字段设置了默认值,未填写时将自动使用默认值。
alt text

元数据过滤

元数据过滤用于在检索时,按元数据条件缩小召回范围。您可以添加一条或多条过滤规则,每条规则形如:[字段] [操作符] [值]
alt text

不同字段类型支持的操作符

字段类型 支持的操作符
文本 等于、不等于、包含、不包含、开头是、结尾是、为空、不为空
数字 等于、不等于、大于、大于等于、小于、小于等于、区间、为空、不为空
日期时间 等于、晚于、不早于、早于、不晚于、区间、为空、不为空
列表 等于、属于(IN)、不属于(NOT IN)、为空、不为空

多条规则的组合

  • 多条规则之间可选择 AND(全部满足)OR(任意满足) 进行组合。
  • 单次最多可配置 10 条规则。
  • 在工作流场景中,规则的「值」除直接输入外,还可引用工作流变量,实现动态过滤。

元数据过滤与访问控制(ACL)是配合关系:系统先按 ACL 限定您可访问的范围,再在该范围内应用元数据过滤,最终取交集进行召回。

应用范围

元数据过滤在以下场景生效:

  • 知识库检索:Agent 从知识库召回知识时按元数据过滤。
  • Bot 对话:在 Bot 的知识库配置中设置过滤条件,对话时自动应用。
  • 工作流 Dataset 节点:节点可单独配置元数据过滤条件。
  • AI Search:工作空间的 AI 搜索按元数据过滤。
  • 检索测试:在检索测试页可临时设置过滤条件,验证召回效果。