快手大模型开发-广告大模型校招一面
快手大模型岗面经
- 实习介绍
- 简历项目深挖
- 奖励函数设计:reward函数是如何设计的?数据集的配比是怎样的?
- 编码树如何构建?为什么使用高斯分布?
- inductive learning和transductive learning有什么区别?
- 实习深挖
- Viking是什么?相关业务背景是什么?
- 冷启动时,不同专家模型特征输入为什么不同
- id特征为什么学习效果不好?
- 手撕
给你整数 delay 和 forget,以及整数 n。每个人在发现秘密后的 delay 天开始,每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密,忘记后不再分享。求第 n 天结束时知道秘密的人数。