美团大模型开发-秋招详细一二面分享
美团大模型岗面经
一面:
- 介绍自己的中厂实习
- 一面的部分实习问题这里也问了。
- 有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
- 模型选型问题,为什么选qwen3-8b,如何估算模型开销。
- 最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
- 接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
- 一个他们组里面的一个具体场景题。
- 手撕k个一组反转链表,并要求最后不足k个的也反转
二面:
- 简历实习项目
- 有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
- 模型选型问题,为什么选qwen3-8b,如何估算模型开销。
- 最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
- 推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
- 场景题:忽略
- 代码题:k个一组反转链表