04. Embedding 模型应该怎么选?
整理 Embedding 选型时需要考虑的因素。
简单回答
Embedding 模型不是越大越好,关键看语种、领域、延迟、成本和你要检索的内容类型。
详细解析
- 如果是中文知识库,要优先看中文语义召回表现,而不是只看英文 benchmark。
- 如果文档包含代码、表格或多模态内容,模型需要对相应模式更敏感。
- 线上场景还要考虑向量维度、编码速度和部署成本,高维向量会增加存储和检索负担。
- 最好通过你自己的数据集做离线召回评估,而不是只凭公开榜单拍脑袋选型。
面试时可以这样答
回答时不要只说“看 leaderboard”,要体现你知道选型要结合业务数据。
常见追问
- 向量维度越大越好吗?
- 为什么通用 embedding 不一定适合垂直领域?