墨圆大模型

【拼多多】大模型开发-大模型算法一面分享

拼多多大模型岗面经

发点面经攒攒人品～

Pretrain 和 SFT 分别解决什么问题？
Transformer 的基本结构怎么理解？
多模态模型的大致结构是什么？最容易踩坑的点通常在哪里？
SFT 数据如何更贴近业务：如何避免过度模板化？如何做基础的 train / test 去重来避免评测失真？
对齐（ RLHF / DPO 等）整体思路是什么：为什么需要偏好对／奖励信号？
玩过 Openclaw 吗？了解其的记忆机制吗？
如果检索返回了很多相关的内容，如何选择最相关的？
了解 embeding 吗？
了解过 spec-drivening 的 code agent 吗？
了解上下文压缩机制吗？
为什么压缩前 70%？最开始的几轮对话明确需求不是很重要吗？

【拼多多】大模型开发-一二面详细面经

【拼多多】大模型开发-大模型算法一面分享多模态大模型一面