04. Embedding 模型应该怎么选?

整理 Embedding 选型时需要考虑的因素。

简单回答

Embedding 模型不是越大越好,关键看语种、领域、延迟、成本和你要检索的内容类型。

详细解析

  • 如果是中文知识库,要优先看中文语义召回表现,而不是只看英文 benchmark。
  • 如果文档包含代码、表格或多模态内容,模型需要对相应模式更敏感。
  • 线上场景还要考虑向量维度、编码速度和部署成本,高维向量会增加存储和检索负担。
  • 最好通过你自己的数据集做离线召回评估,而不是只凭公开榜单拍脑袋选型。

面试时可以这样答

回答时不要只说“看 leaderboard”,要体现你知道选型要结合业务数据。

常见追问

  • 向量维度越大越好吗?
  • 为什么通用 embedding 不一定适合垂直领域?