01. 什么是 RAG?它主要解决了什么问题?

整理 RAG 的定义、核心价值和适用边界。

简单回答

RAG 是检索增强生成,本质上是在模型回答前,先从外部知识库检索相关内容,再把检索结果作为上下文提供给模型生成答案。

详细解析

  • 它主要解决三类问题:模型参数知识不够新、私有知识无法直接写进底座模型、纯生成容易幻觉。
  • 相比直接微调,RAG 对知识更新更灵活,改文档即可,不必每次都重新训练模型。
  • 但 RAG 也不是万能的,它更适合知识密集型任务,不一定能直接提升复杂推理或格式控制能力。
  • 面试时应把 RAG 讲成“检索系统 + 大模型生成”的组合,而不是只说“给模型喂资料”。

面试时可以这样答

一句好回答通常会同时说清“为什么要用”和“什么时候不该乱用”。

常见追问

  • RAG 和微调是什么关系?
  • RAG 为什么还能减少幻觉?