【拼多多】大模型开发-社招一面凉经

拼多多大模型岗面经

  1. Lora微调的原理,涉及的参数和调试心得
  2. DPO原理和涉及的参数作用
  3. GRPO原理
  4. 手写attention
  5. 手写交叉熵
  6. 手写最短的大于等于目标值的连续数组