05. 限流、熔断、降级在大模型系统里分别起什么作用?

整理稳定性治理的三类基础机制。

简单回答

限流用于控制流量上限,熔断用于在依赖异常时快速失败,降级用于在资源紧张或依赖失效时保住核心功能。

详细解析

  • 大模型调用成本高、时延长、外部依赖多,因此比普通接口更容易在高峰期出问题。
  • 限流可以防止系统被突发流量压垮,熔断可以避免故障在下游持续放大。
  • 降级可以表现为切换更小模型、关闭重排、缩短上下文或只返回检索结果。
  • 这些机制的目标都是让系统在坏情况下仍然可控。

面试时可以这样答

回答时最好顺手举一个降级例子,这样更像生产经验。

常见追问

  • 什么情况下该触发降级?
  • 降级会影响哪些指标?