08. 线上 A/B Test 和评测流水线应该怎么做?
整理模型产品线上评估的基本方法。
简单回答
线上 A/B Test 的目标是用真实用户数据比较不同方案,不只是看离线分数谁高。
详细解析
- 先设定清晰指标,比如点击率、转化率、完成率、人工接管率、时延和成本。
- 流量分桶要随机且可回溯,避免样本偏差和环境不一致。
- 同时要保留离线评测集,避免线上结果完全被短期流量噪声左右。
- 成熟系统通常是离线评测、灰度发布、线上对比、复盘回收四步闭环。
面试时可以这样答
面试时把“离线评测 + 灰度 + A/B + 回滚”讲成流程,会比只说 A/B Test 更完整。
常见追问
- 如何避免线上 A/B 带来风险?
- 什么时候离线高分却线上没收益?