10. RAG 效果差时应该怎么排查?

整理 RAG 系统的分层排查思路。

简单回答

排查 RAG 不要一上来就换模型,应该先把问题拆到查询、召回、重排、上下文拼装和生成五层去定位。

详细解析

  • 先看用户问题是否需要改写,是否存在错别字、歧义或意图不明。
  • 再看召回是否命中了正确文档,如果没命中,问题多半在切分、embedding 或索引策略。
  • 如果命中了但排序不靠前,要重点检查重排和分数融合。
  • 如果证据已经进了上下文但答案仍然不好,就去看 prompt、上下文组织和模型本身的遵循能力。

面试时可以这样答

一套分层排查框架,比单独背某个优化技巧更能体现工程能力。

常见追问

  • 怎么判断问题在 recall 还是 generation?
  • RAG 排查时先看哪些日志?