01. 什么是 RAG?它主要解决了什么问题?
整理 RAG 的定义、核心价值和适用边界。
简单回答
RAG 是检索增强生成,本质上是在模型回答前,先从外部知识库检索相关内容,再把检索结果作为上下文提供给模型生成答案。
详细解析
- 它主要解决三类问题:模型参数知识不够新、私有知识无法直接写进底座模型、纯生成容易幻觉。
- 相比直接微调,RAG 对知识更新更灵活,改文档即可,不必每次都重新训练模型。
- 但 RAG 也不是万能的,它更适合知识密集型任务,不一定能直接提升复杂推理或格式控制能力。
- 面试时应把 RAG 讲成“检索系统 + 大模型生成”的组合,而不是只说“给模型喂资料”。
面试时可以这样答
一句好回答通常会同时说清“为什么要用”和“什么时候不该乱用”。
常见追问
- RAG 和微调是什么关系?
- RAG 为什么还能减少幻觉?