logo
开发者文档
搜索
向量

向量

Agent 内所有的知识文档被添加后,每个知识切片均会被嵌入为向量,并储存于向量数据库内。检索时,系统会把用户问题也转为向量,计算与各切片的语义相似度,召回最相关的切片交给 LLM 使用。

切片管理

image-20240220122305897

您可以查看每一个知识文档的切片。

image-20240220122406244

在切片管理内,您可以对切片进行编辑,以更新知识。

检索模式

系统支持三种检索模式,您可以根据知识内容的特点选择:

loading...
graph TD
M[检索模式] --> A[混合检索]
M --> B[语义检索]
M --> C[关键词检索]
A --> A1[向量 + 关键词,可调权重]
B --> B1[按语义相似度,理解同义改写]
C --> C1[按字面关键词匹配]
  • 混合检索(推荐):同时使用语义与关键词,并可通过「向量权重」调节二者比重,兼顾语义理解与精确匹配。
  • 语义检索:仅按语义相似度召回,擅长理解同义、改写、口语化的问题。
  • 关键词检索:仅按字面关键词匹配,擅长专有名词、编号、术语等精确查找。

检索参数

在 Bot 的知识库配置中,您可以调整以下检索参数:

参数 取值范围 说明
搜索模式 混合 / 语义 / 关键词 见上文「检索模式」
向量权重 0 ~ 1(默认 0.5) 仅混合模式可用;越接近 1 越偏语义,越接近 0 越偏关键词
相似度阈值 0.1 ~ 0.95 召回的最低相关性门槛;越高要求越严格,召回越少但越精准
召回数量(TopK) 1 ~ 50 单次最多召回的切片数量
知识重排 开 / 关 开启后用重排模型对召回结果二次排序,提升排序质量
重排模型 可选 重排开启时选择使用的 Rerank 模型
问题增强 开 / 关 开启后对用户问题进行改写/扩展,提升召回覆盖面
知识调用方式 强制调用 / 按需调用 「强制」每次都检索知识库;「按需」由 LLM 判断是否需要检索
无相关知识时的回复 开 / 关 + 自定义文本 当未召回到达标知识时,可设置返回一段预设提示文本

检索参数没有「万能最优值」。建议先用默认值,再结合下文的命中测试逐项微调。相似度阈值偏高会更精准但可能漏召回;偏低召回更全但可能引入噪声。

此外,您还可以在检索配置中开启 元数据过滤知识图谱 召回,进一步控制召回范围与召回方式。

命中测试(向量检索)

image-20240220122438124

您可以输入 Agent 用户有可能提问的问题,进行向量检索(命中测试)。

通过观察召回的知识切片的内容,您可以对当前知识库内容的检索效果进行评估。命中测试页同样支持调整上述检索参数、设置元数据过滤、开启图谱召回,便于您在上线前反复验证不同配置下的召回质量。