02. 一个完整的 RAG 系统通常包含哪些环节?

整理 RAG 的端到端链路。

简单回答

完整的 RAG 链路通常包括文档接入、清洗切分、向量化索引、查询改写、召回、重排、上下文拼装和答案生成。

详细解析

  • 离线阶段重点是把知识变成可检索、可维护的索引。
  • 在线阶段重点是把用户问题转成更适合检索的查询,再从大量候选中筛出最相关内容。
  • 召回后通常还要重排,否则进入生成阶段的上下文质量不稳定。
  • 最终答案并不只取决于模型本身,而是取决于整条链路每一层都有没有把信息传对。

面试时可以这样答

面试时建议按“离线建库 + 在线问答”分段讲,这样结构最清楚。

常见追问

  • 哪一环最容易出问题?
  • RAG 为什么常常要两阶段甚至三阶段检索?