【腾讯】-大模型开发-一二面实习面经,还得练

腾讯大模型岗面经

一面

八股

  1. 强化学习相关的方法
  2. 对ppo的了解,grpo,dapo的了解,grpo可能有哪些劣势,ppo的value model为什么能够计算出平均的baseline奖励
  3. grpo的rollout是多少,为什么不用连续的奖励
  4. coding:x求平方根

二面

面试很难,还是要多多练习,感觉自己说不明白业务逻辑

  1. leetcode LRU+长度最小子数组
  2. 实习拷打
  3. 微调介绍
  4. PPO, DPO, GRPO
  5. ES底层存储原理
  6. Redis分布式架构
  7. langchain介绍
  8. 限流算法?
  9. 推理框架