【字节】-大模型开发-高强度拷打凉经

字节大模型岗面经

一面

  1. 实习拷打
  2. 项目拷打
  3. 八股
    1. GPRO 相比 PPO 的优缺点是什么?
    2. PPO 是如何计算优势的?GAE的原理?
    3. 有了解过除了 GRPO 的其他强化学习训练方法么?
  4. DAPO 改进了什么地方?
  5. 你觉得 VERL 框架如果用 DAPO 该改哪些地方?
  6. DPO的原理是什么?如何推导出来的?
  7. 重要性采样的原理?
  8. SGD、Adam、AdamW 的区别和改进
  9. 你平常使用什么编程语言?Python 精通么?
  10. Python 的** 是干什么的,**kwargs 是干嘛的,@字符是干嘛的?装饰器的原理是什么?
  11. 平时用什么 AI编程软件?有对比过 cursor里面不同模型的效果么?
  12. 你觉得大模型未来会朝着哪里发展?
  13. 你做的这些项目,如果回过头来,哪个最想迭代改善?
  14. 代码 : Leetcode718 最长重复子数组

二面

  1. 项目拷打
  2. Decoder文本生成有哪几种方法
  3. 还知道哪些多模态大模型
  4. 介绍一下ALBEF、BLIP
  5. BLIP2的结构是什么 两阶段怎么训练的 有哪些损失
  6. 知道PEFT吗 讲一下LoRA
  7. 还有什么微调方法 -> prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的