墨圆大模型

快手大模型开发-广告大模型校招一面

快手大模型岗面经

实习介绍
简历项目深挖

奖励函数设计：reward函数是如何设计的？数据集的配比是怎样的？
编码树如何构建？为什么使用高斯分布？

inductive learning和transductive learning有什么区别？
实习深挖

Viking是什么？相关业务背景是什么？
冷启动时，不同专家模型特征输入为什么不同
id特征为什么学习效果不好？

手撕

给你整数 delay 和 forget，以及整数 n。每个人在发现秘密后的 delay 天开始，每天可以分享给一个新的人。在发现秘密 forget 天后会忘记秘密，忘记后不再分享。求第 n 天结束时知道秘密的人数。

快手大模型开发-kstar大模型一面

快手大模型开发-日常实习LLM二面分享