06. Recall 和 Rerank 的区别是什么?为什么很多系统要分两阶段检索?
整理召回与重排的角色分工。
简单回答
Recall 的目标是快而全地找回候选,Rerank 的目标是慢一些但更准地把真正相关的内容排到前面。
详细解析
- 如果一开始就对全库做高精度匹配,成本会很高;所以先用便宜方法粗筛,再用昂贵模型精排更合理。
- Recall 常见用 embedding 相似度、关键词或混合检索,Rerank 常见用 cross-encoder 或大模型重评分。
- 两阶段设计的本质是把效率和精度拆开优化。
- 很多线上 RAG 的最终答案质量,实际上更依赖重排质量,而不是第一阶段召回分数。
面试时可以这样答
面试时最好顺手补一句:Recall 负责“别漏”,Rerank 负责“别错”。
常见追问
- Rerank 放几条最合适?
- 为什么 recall 分高不代表最终效果好?