美团大模型开发-暑期实习第一面
美团大模型岗面经
- 项目拷打
- lora作用在q,k和作用在FFN上有什么差异
- FFN是干嘛的?
- 大模型不同层存什么信息?
- 讲讲lora,什么时候考虑用lora,什么时候用全量参数微调?
- lora和全量参数微调学习率的对比
- 项目二拷打
- 怎么找到badcase,怎么找到原因,怎么确定是哪个原因导致的badcase?
- DPO怎么判断模型有没有训练好?看什么东西?怎么证明模型有区分度?DPO结束后用什么指标评估
- 推理加速你都了解哪些?
- 讲一下智能体React 和Reflection范式的区别
- 长期记忆和短期记忆是什么?怎么设置
- 了解上下文管理吗?
- 怎么根据模型输出优化提示词?怎么评估提示词的好坏?写提示词的本质是什么?从数学的角度讲一下提示词是怎么改变模型输出的?
- 最后是一个AI coding,写一个整理工作周报自动发送到老板邮箱的系统,要求分成至少5个子任务,指出那些需要人工参与,那些是全自动的,还有就是如果用户这周没有记录,该怎么处理这种异常