06. Recall 和 Rerank 的区别是什么?为什么很多系统要分两阶段检索?

整理召回与重排的角色分工。

简单回答

Recall 的目标是快而全地找回候选,Rerank 的目标是慢一些但更准地把真正相关的内容排到前面。

详细解析

  • 如果一开始就对全库做高精度匹配,成本会很高;所以先用便宜方法粗筛,再用昂贵模型精排更合理。
  • Recall 常见用 embedding 相似度、关键词或混合检索,Rerank 常见用 cross-encoder 或大模型重评分。
  • 两阶段设计的本质是把效率和精度拆开优化。
  • 很多线上 RAG 的最终答案质量,实际上更依赖重排质量,而不是第一阶段召回分数。

面试时可以这样答

面试时最好顺手补一句:Recall 负责“别漏”,Rerank 负责“别错”。

常见追问

  • Rerank 放几条最合适?
  • 为什么 recall 分高不代表最终效果好?