07. 成本高时你一般有哪些优化思路?
整理大模型项目中的常见成本优化手段。
简单回答
成本优化通常从三处入手:减少不必要请求、减少单次请求消耗、把高成本模型只留给关键场景。
详细解析
- 先看能否通过缓存、检索前置和规则过滤减少模型调用次数。
- 再看能否缩短上下文、减少输出长度、优化提示词和使用更小模型。
- 如果系统里有多级策略,可以把高价值请求路由到更强模型,普通请求走轻量方案。
- 成本优化不只是省钱,还经常能顺带降低时延和提升系统稳定性。
面试时可以这样答
回答时要体现你知道成本来自哪里,而不是只说“换便宜模型”。
常见追问
- 如何评估降本是否影响效果?
- 哪些请求最适合做缓存?