01. 预训练、继续预训练和 SFT 有什么区别?

整理三种训练阶段的目标、数据与适用场景。

简单回答

三者的区别在于训练目标和数据形态不同:预训练偏通用语言建模,继续预训练偏领域适配,SFT 偏任务指令对齐。

详细解析

  • 预训练通常使用海量通用语料,让模型学会语言规律、知识模式和基础能力。
  • 继续预训练常用于行业语料补充,比如金融、法律、医疗或公司内部知识,使模型更懂特定领域表达。
  • SFT 通常使用指令-回答或问答数据,目标是让模型更符合任务格式和对话习惯。
  • 从面试表达上,最好讲成“通用能力 → 领域能力 → 任务行为”三层递进关系。

面试时可以这样答

回答时把三种阶段放进同一条训练流水线里讲,通常比孤立定义更容易打动面试官。

常见追问

  • 继续预训练和知识注入有什么关系?
  • SFT 能替代继续预训练吗?