10. RAG 效果差时应该怎么排查?
整理 RAG 系统的分层排查思路。
简单回答
排查 RAG 不要一上来就换模型,应该先把问题拆到查询、召回、重排、上下文拼装和生成五层去定位。
详细解析
- 先看用户问题是否需要改写,是否存在错别字、歧义或意图不明。
- 再看召回是否命中了正确文档,如果没命中,问题多半在切分、embedding 或索引策略。
- 如果命中了但排序不靠前,要重点检查重排和分数融合。
- 如果证据已经进了上下文但答案仍然不好,就去看 prompt、上下文组织和模型本身的遵循能力。
面试时可以这样答
一套分层排查框架,比单独背某个优化技巧更能体现工程能力。
常见追问
- 怎么判断问题在 recall 还是 generation?
- RAG 排查时先看哪些日志?