快手大模型开发-26校招算法一面

快手大模型岗面经

  1. pre-train怎么做的,用了哪些数据
  2. 说一个电商领域的数据构造方法
  3. pre-train之后怎么sft的
  4. 简单说下dapo4.(我提到了用DAPO做rft)
  5. dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
  6. (我提到了大模型推理慢)说一下推理慢的原因
  7. 模型有上线吗?下游任务的业务效果如何?
  8. 有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
  9. function-call怎么训练的,语料如何构建

手撕:最小回文串

反问

  1. which部门
  2. what业务
  3. 当前基座研究进展