快手大模型开发-广告大模型校招一面

快手大模型岗面经

  1. 实习介绍
  2. 简历项目深挖
  • 奖励函数设计:reward函数是如何设计的?数据集的配比是怎样的?
  • 编码树如何构建?为什么使用高斯分布?
  1. inductive learning和transductive learning有什么区别?
  2. 实习深挖
  • Viking是什么?相关业务背景是什么?
  • 冷启动时,不同专家模型特征输入为什么不同
  • id特征为什么学习效果不好?
  1. 手撕

给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。