美团大模型开发-秋招详细一二面分享

美团大模型岗面经

一面:

  1. 介绍自己的中厂实习
  2. 一面的部分实习问题这里也问了。
  3. 有没有试过外挂数据库来解决线上业务数据分布更新较快的问题,
  4. 模型选型问题,为什么选qwen3-8b,如何估算模型开销。
  5. 最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
  6. 接触过哪些推理加速的方法。(vllm的page-attention, kv cache, prefix cachemla,flash-attention直接安排一套)
  7. 一个他们组里面的一个具体场景题。
  8. 手撕k个一组反转链表,并要求最后不足k个的也反转

二面:

  1. 简历实习项目
  2. 有没有试过外挂数据库来解决线上业务数据分布更新较快的问题
  3. 模型选型问题,为什么选qwen3-8b,如何估算模型开销。
  4. 最多做过几卡的模型训练?对deepspeed和Megatron有多少了解?
  5. 推理加速的方法。(vlm的page-attention, kv cacheprefix cachemla, flash-attention等
  6. 场景题:忽略
  7. 代码题:k个一组反转链表