【腾讯】-大模型开发-混元大模型算法一面

腾讯大模型岗面经

  1. 项目拷打
  2. 实习拷打
  3. 你提到用了CKA你能解释一下它是怎么计算的吗?这个指标真的能评估对齐程度吗
  4. ModalityAdapter模态适配器这个模块你是怎么设计的?它是怎么起作用的?有没有做过ablation实验?
  5. 对比学习里你怎么构造正负样本的?正负样本不容易区分的时候你们是怎么处理的?有没有用HNM
  6. 你们项目里用了多个loss比如MSE + Contrastive Loss + KL 散度为什么这么设计?有没有出现loss拉扯现象
  7. 医疗组手那个项目你说做了Prompt模板设计,能不能举几个例子?分类模板和生成式模板在你们场景下分别怎么做的
  8. 你们用的知识库是静态的吗?有没有做向量索引?用的什么方案
  9. 怎么避免模型产生医疗幻觉?你们有没有做 hallucination 率评估
  10. 你用过哪些模型推理框架?你觉得Ollama和vLLM区别在哪儿?在车端你们选它们的依据是什么?
  11. 你们说做了14B的车端模型,你们是怎么用SFT数据去做微调的?数据怎么构建的
  12. 评测体系你是怎么搭建的?评测指标都有哪些
  13. 你说你们构建了车载Agent平台Agent链路是怎么调度的多轮对话怎么做状态维护?
  14. Rewrite模型是你做的,具体输入输出是什么?你们是把 rewrite放在检索前还是后?训练数据是人工构造的吗?
  15. 你现在要设计一个多模态模型用于车内驾驶员状态识别,传感器包括摄像头和力传感器,你会怎么设计这个 pipeline