快手大模型开发-26校招算法一面
快手大模型岗面经
- pre-train怎么做的,用了哪些数据
- 说一个电商领域的数据构造方法
- pre-train之后怎么sft的
- 简单说下dapo4.(我提到了用DAPO做rft)
- dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
- (我提到了大模型推理慢)说一下推理慢的原因
- 模型有上线吗?下游任务的业务效果如何?
- 有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
- function-call怎么训练的,语料如何构建
手撕:最小回文串
反问:
- which部门
- what业务
- 当前基座研究进展