快手大模型开发-一轮挂喜提人才库

快手大模型岗面经

  1. attention中数据shape是batch first还是seq_len first
  2. Prompt长度加倍,首token延迟加倍吗
  3. 模型选型时是否做定性定量对比ab test,客观数据验证文心性能不好了吗
  4. SFT过程中遇到了哪些问题和解决方案?
  5. 如何定性定量评估数据集质量,单条和整体数据集质量?
  6. 单一分类模型,细分分类模型和MOE融合的优劣。
  7. MHA手写