墨圆大模型

【腾讯】-大模型开发-一二面实习面经，还得练

腾讯大模型岗面经

一面

八股

强化学习相关的方法
对ppo的了解，grpo，dapo的了解，grpo可能有哪些劣势，ppo的value model为什么能够计算出平均的baseline奖励
grpo的rollout是多少，为什么不用连续的奖励
coding：x求平方根

二面

面试很难，还是要多多练习，感觉自己说不明白业务逻辑

leetcode LRU+长度最小子数组
实习拷打
微调介绍
PPO, DPO, GRPO
ES底层存储原理
Redis分布式架构
langchain介绍
限流算法?
推理框架

【腾讯】-大模型开发-双非勇闯大厂LLM面经

【阿里】-大模型开发-校招一面，俺不中嘞