07. 什么是 Hybrid Search?什么时候需要混合检索?
整理混合检索的定义和适用场景。
简单回答
Hybrid Search 是把向量语义检索和关键词检索结合起来,用来同时兼顾语义理解和精确匹配。
详细解析
- 纯向量检索擅长语义相近,但对专有名词、编号、时间、接口名这类精确字符串未必稳。
- 纯关键词检索擅长精确命中,但对改写表达、同义说法和自然语言问题理解不足。
- 混合检索特别适合企业知识库、技术文档、FAQ、工单、产品手册这类既有术语又有语义表达的场景。
- 它通常不是简单拼接,而是需要做分数融合和去重策略设计。
面试时可以这样答
一个实战型回答要能说出:什么时候 BM25 是必须留着的。
常见追问
- 分数融合怎么做?
- 混合检索一定比纯向量好吗?