【字节】-大模型开发-抖音电商多模态大模型面经

字节大模型岗面经

  1. 自我介绍
  2. sft阶段用的什么模型,数据来源,如何做数据处理,用的什么框架
  3. ppo如何做的详细介绍,包括数据,怎么训练奖励模型,每个模型的损失什么样子的,在几张卡上做的训练
  4. dpo训练流程,为什么 ppo 和 dpo 你都用了,有什么区别,有没有做对比试验
  5. 怎么评估你微调之后模型有提升
  6. ppo为什么效果会比 dpo 强,怎么理解多轮 dpo 会有提升
  7. 项目中创新点外代码中怎么实现的,详细讲讲,消融实验怎么做的
  8. clip训练原理
  9. 深度学习相关知识,讲几种优化器
  10. 讲 MHA 原理
  11. GRPO原理
  12. Lora原理, r 大小对模型训练的影响
  13. vit训练原理
  14. swin transformer 的原理
  15. qwen3快思考和慢思考的原理
  16. 手撕