【京东】大模型开发-50分钟高强度拷打
京东大模型岗面经
- 实习介绍
- 常见的的大模型,或者说VLM这块的模型,了解过哪些?
- Qwen 2.5 VL相对Qwen 2 VL做了哪些改进?
- 追问了M-RoPE比原来的ROPE有什么改进?有什么优点?
- 原来的ROPE在升级成M-ROPE之前,它是怎么处理视频的?具体来说,对于每一个每一帧或者说每一个patch,是怎么处理的?
- 然后互相聊了不少项目,偏聊天风格,基本都是short talk,并不都是问答
- 项目:主要想解决的核心问题是什么?
- 项目:既然是一个垂类的一个场景,为什么要去用通用场景下的VLM来做?为什么不用已经具有领域知识的一些模型?
- 项目:为什么你的VLM是输出点的坐标,而不输出bbox呢,bbox按道理比点的坐标具有更多的图像信息吧?
- 讲一下SAM2分割模型的原理
- 项目:SFT框架用的是什么?
- 项目:SFT数据的合成pipeline,详细讲解一
- 项目:数据是用算法生成的,你们怎么判断这一批数据是好的还是不好的呢?
- 算法题:lc70 爬楼梯