【滴滴】大模型开发-社招大模型推理岗

滴滴大模型岗面经

自我介绍 提问简历上的内容。

面试官拷打:

  1. 模型量化之后发现精度损失比较大,怎么发现问题并解决。
  2. 用cuda实现一个元素级乘法时有什么优化手段。
  3. GPU的架构是什么样的。介绍下GPU的存储架构。
  4. 还了解过其他什么量化的优化手段。

手撕代码 给你一个矩阵,要求你找到数值为0的元素,将它同行和同列的元素均置为0,要求空间复杂度O(1)

反问环节 模型部署在什么平台,现在团队多少人,base哪里,面试有多少轮。