02. 一个完整的 RAG 系统通常包含哪些环节?
整理 RAG 的端到端链路。
简单回答
完整的 RAG 链路通常包括文档接入、清洗切分、向量化索引、查询改写、召回、重排、上下文拼装和答案生成。
详细解析
- 离线阶段重点是把知识变成可检索、可维护的索引。
- 在线阶段重点是把用户问题转成更适合检索的查询,再从大量候选中筛出最相关内容。
- 召回后通常还要重排,否则进入生成阶段的上下文质量不稳定。
- 最终答案并不只取决于模型本身,而是取决于整条链路每一层都有没有把信息传对。
面试时可以这样答
面试时建议按“离线建库 + 在线问答”分段讲,这样结构最清楚。
常见追问
- 哪一环最容易出问题?
- RAG 为什么常常要两阶段甚至三阶段检索?