向量

Agent 内所有的知识文档被添加后，每个知识切片均会被嵌入为向量，并储存于向量数据库内。检索时，系统会把用户问题也转为向量，计算与各切片的语义相似度，召回最相关的切片交给 LLM 使用。

切片管理

您可以查看每一个知识文档的切片。

在切片管理内，您可以对切片进行编辑，以更新知识。

系统支持三种检索模式，您可以根据知识内容的特点选择：

graph TD
M[检索模式] --> A[混合检索]
M --> B[语义检索]
M --> C[关键词检索]
A --> A1[向量 + 关键词，可调权重]
B --> B1[按语义相似度，理解同义改写]
C --> C1[按字面关键词匹配]

在 Bot 的知识库配置中，您可以调整以下检索参数：

参数	取值范围	说明
搜索模式	混合 / 语义 / 关键词	见上文「检索模式」
向量权重	0 ～ 1（默认 0.5）	仅混合模式可用；越接近 1 越偏语义，越接近 0 越偏关键词
相似度阈值	0.1 ～ 0.95	召回的最低相关性门槛；越高要求越严格，召回越少但越精准
召回数量（TopK）	1 ～ 50	单次最多召回的切片数量
知识重排	开 / 关	开启后用重排模型对召回结果二次排序，提升排序质量
重排模型	可选	重排开启时选择使用的 Rerank 模型
问题增强	开 / 关	开启后对用户问题进行改写/扩展，提升召回覆盖面
知识调用方式	强制调用 / 按需调用	「强制」每次都检索知识库；「按需」由 LLM 判断是否需要检索
无相关知识时的回复	开 / 关 + 自定义文本	当未召回到达标知识时，可设置返回一段预设提示文本

检索参数没有「万能最优值」。建议先用默认值，再结合下文的命中测试逐项微调。相似度阈值偏高会更精准但可能漏召回；偏低召回更全但可能引入噪声。

此外，您还可以在检索配置中开启元数据过滤与知识图谱召回，进一步控制召回范围与召回方式。

您可以输入 Agent 用户有可能提问的问题，进行向量检索（命中测试）。

通过观察召回的知识切片的内容，您可以对当前知识库内容的检索效果进行评估。命中测试页同样支持调整上述检索参数、设置元数据过滤、开启图谱召回，便于您在上线前反复验证不同配置下的召回质量。