【京东】大模型开发-50分钟高强度拷打

京东大模型岗面经

  1. 实习介绍
  2. 常见的的大模型,或者说VLM这块的模型,了解过哪些?
  3. Qwen 2.5 VL相对Qwen 2 VL做了哪些改进?
  4. 追问了M-RoPE比原来的ROPE有什么改进?有什么优点?
  5. 原来的ROPE在升级成M-ROPE之前,它是怎么处理视频的?具体来说,对于每一个每一帧或者说每一个patch,是怎么处理的?
  6. 然后互相聊了不少项目,偏聊天风格,基本都是short talk,并不都是问答
  7. 项目:主要想解决的核心问题是什么?
  8. 项目:既然是一个垂类的一个场景,为什么要去用通用场景下的VLM来做?为什么不用已经具有领域知识的一些模型?
  9. 项目:为什么你的VLM是输出点的坐标,而不输出bbox呢,bbox按道理比点的坐标具有更多的图像信息吧?
  10. 讲一下SAM2分割模型的原理
  11. 项目:SFT框架用的是什么?
  12. 项目:SFT数据的合成pipeline,详细讲解一
  13. 项目:数据是用算法生成的,你们怎么判断这一批数据是好的还是不好的呢?
  14. 算法题:lc70 爬楼梯