元数据
元数据
元数据(Metadata)是为知识库文档附加的「结构化标签」,例如文档的来源、上传时间、所属部门、产品线、生效日期等。
为知识打上元数据后,您可以在检索时按元数据精准过滤——例如「只检索 2025 年之后、来源为官方手册的文档」,让 Agent 在更小、更相关的范围内召回知识,从而提升回答的准确性。
字段类型与作用范围
元数据在GPTBots中分为系统预置元数据、全局元数据和知识库元数据三大类。
- 系统预置元数据:由系统自动记录,包含文档的基本信息;自定义字段则由用户创建,支持文本、数字、日期时间、列表等多种类型,用于满足不同的业务需求。
- 全局元数据:属于自定义元数据,在知识库列表页配置,对组织内所有知识库生效,适合统一的全局标签(如「保密级别」「业务线」)。
- 知识库元数据:属于自定义元数据,仅在某个知识库内配置,仅对该知识库生效,适合该库特有的字段。
系统预置元数据
文档被添加时,系统会自动记录一组预置元数据字段,无需您手动填写:
| 字段 | 含义 |
|---|---|
| 知识库名称 | 文档所属知识库的名称 |
| 文档名称 | 文档的名称 |
| 上传者 | 添加该文档的成员 |
| 上传者邮箱 | 添加者的邮箱 |
| 上传时间 | 文档首次添加的时间 |
| 最后更新时间 | 文档最近一次更新的时间 |
| 来源链接 | 文档的来源 URL(如通过 URL 添加) |
| 来源 | 文档的添加方式(文件 / URL / 文本等) |
| 数据存储类型 | 知识的存储结构(如 Q&A、表格、结构化、Markdown) |
| 文档格式 | 文档的文件格式(如 pdf、docx、md) |
预置字段不可重命名、不可删除、不可修改类型,仅可调整其在界面上的显示名称等展示属性。
全局元数据与知识库元数据
自定义创建的元数据字段分为两个作用范围,不同范围决定字段对哪些知识库生效。管理员可以根据业务需求选择合适的作用范围来创建字段:
loading...
graph TD E[全局元数据] -->|对所有知识库生效| KB1[知识库 A] E --> KB2[知识库 B] E --> KB3[知识库 C] G[知识库A元数据] -->|仅对当前知识库生效| KB1
管理元数据字段

- 进入知识库(企业级字段则在知识库列表页),点击【元数据】打开元数据管理面板。
- 点击【Add Field】新建字段,选择类型并填写字段名、显示名称、默认值等信息。
- 点击列表中的某个字段可进入编辑;预置字段仅可修改展示属性。
- 在字段编辑面板底部可【删除】自定义字段(预置字段不可删除)。

除系统预置的元数据字段外,您还可以创建自定义字段,用业务维度组织知识。自定义字段支持以下类型:
| 类型 | 说明 | 典型用途 |
|---|---|---|
| 文本(STRING) | 任意字符串 | 部门、负责人、产品线 |
| 数字(NUMBER) | 数值,支持比较与范围 | 版本号、优先级、年份 |
| 日期时间(DATETIME) | 时间,支持「之前/之后/区间」 | 生效日期、过期日期 |
| 列表(LIST) | 预设选项,单选/多选 | 标签、分类、状态 |
创建自定义元数据字段时最多可创建 50 个,可配置:
- 字段名(name):用于检索与存储的标识,需符合命名规则(小写字母开头,由小写字母、数字、下划线组成,最长 32 个字符)。创建后不可修改。
- 显示名称(displayLabel):界面上展示的名称,可修改。
- 字段类型:见上表,创建后不可修改。
- 选项(仅列表类型):可选值清单。
- 默认值:新文档未填写时自动填充的值。
- 描述:字段说明,最长 50 字符。
为文档设置元数据值
系统字段由系统自动填充。对于自定义字段,您可以在文档详情页为每个文档填写或修改对应的元数据值;若字段设置了默认值,未填写时将自动使用默认值。
元数据过滤
元数据过滤用于在检索时,按元数据条件缩小召回范围。您可以添加一条或多条过滤规则,每条规则形如:[字段] [操作符] [值]。
不同字段类型支持的操作符
| 字段类型 | 支持的操作符 |
|---|---|
| 文本 | 等于、不等于、包含、不包含、开头是、结尾是、为空、不为空 |
| 数字 | 等于、不等于、大于、大于等于、小于、小于等于、区间、为空、不为空 |
| 日期时间 | 等于、晚于、不早于、早于、不晚于、区间、为空、不为空 |
| 列表 | 等于、属于(IN)、不属于(NOT IN)、为空、不为空 |
多条规则的组合
- 多条规则之间可选择 AND(全部满足) 或 OR(任意满足) 进行组合。
- 单次最多可配置 10 条规则。
- 在工作流场景中,规则的「值」除直接输入外,还可引用工作流变量,实现动态过滤。
元数据过滤与访问控制(ACL)是配合关系:系统先按 ACL 限定您可访问的范围,再在该范围内应用元数据过滤,最终取交集进行召回。
应用范围
元数据过滤在以下场景生效:
- 知识库检索:Agent 从知识库召回知识时按元数据过滤。
- Bot 对话:在 Bot 的知识库配置中设置过滤条件,对话时自动应用。
- 工作流 Dataset 节点:节点可单独配置元数据过滤条件。
- AI Search:工作空间的 AI 搜索按元数据过滤。
- 检索测试:在检索测试页可临时设置过滤条件,验证召回效果。
