向量
向量
Agent 内所有的知识文档被添加后,每个知识切片均会被嵌入为向量,并储存于向量数据库内。检索时,系统会把用户问题也转为向量,计算与各切片的语义相似度,召回最相关的切片交给 LLM 使用。
切片管理

您可以查看每一个知识文档的切片。

在切片管理内,您可以对切片进行编辑,以更新知识。
检索模式
系统支持三种检索模式,您可以根据知识内容的特点选择:
loading...
graph TD M[检索模式] --> A[混合检索] M --> B[语义检索] M --> C[关键词检索] A --> A1[向量 + 关键词,可调权重] B --> B1[按语义相似度,理解同义改写] C --> C1[按字面关键词匹配]
- 混合检索(推荐):同时使用语义与关键词,并可通过「向量权重」调节二者比重,兼顾语义理解与精确匹配。
- 语义检索:仅按语义相似度召回,擅长理解同义、改写、口语化的问题。
- 关键词检索:仅按字面关键词匹配,擅长专有名词、编号、术语等精确查找。
检索参数
在 Bot 的知识库配置中,您可以调整以下检索参数:
| 参数 | 取值范围 | 说明 |
|---|---|---|
| 搜索模式 | 混合 / 语义 / 关键词 | 见上文「检索模式」 |
| 向量权重 | 0 ~ 1(默认 0.5) | 仅混合模式可用;越接近 1 越偏语义,越接近 0 越偏关键词 |
| 相似度阈值 | 0.1 ~ 0.95 | 召回的最低相关性门槛;越高要求越严格,召回越少但越精准 |
| 召回数量(TopK) | 1 ~ 50 | 单次最多召回的切片数量 |
| 知识重排 | 开 / 关 | 开启后用重排模型对召回结果二次排序,提升排序质量 |
| 重排模型 | 可选 | 重排开启时选择使用的 Rerank 模型 |
| 问题增强 | 开 / 关 | 开启后对用户问题进行改写/扩展,提升召回覆盖面 |
| 知识调用方式 | 强制调用 / 按需调用 | 「强制」每次都检索知识库;「按需」由 LLM 判断是否需要检索 |
| 无相关知识时的回复 | 开 / 关 + 自定义文本 | 当未召回到达标知识时,可设置返回一段预设提示文本 |
检索参数没有「万能最优值」。建议先用默认值,再结合下文的命中测试逐项微调。相似度阈值偏高会更精准但可能漏召回;偏低召回更全但可能引入噪声。
此外,您还可以在检索配置中开启 元数据过滤 与 知识图谱 召回,进一步控制召回范围与召回方式。
命中测试(向量检索)

您可以输入 Agent 用户有可能提问的问题,进行向量检索(命中测试)。
通过观察召回的知识切片的内容,您可以对当前知识库内容的检索效果进行评估。命中测试页同样支持调整上述检索参数、设置元数据过滤、开启图谱召回,便于您在上线前反复验证不同配置下的召回质量。
