05. 向量数据库应该怎么选?
整理向量库选型时的核心维度。
简单回答
向量数据库的核心不是名字,而是它在索引能力、过滤能力、扩展性、运维复杂度和生态集成上的匹配程度。
详细解析
- 如果数据量不大,本地轻量方案可能已经够用;数据量和并发大了,就要更关注分布式扩展和稳定性。
- 检索并不只有向量,还经常伴随 metadata 过滤,因此标量过滤和混合检索能力也很重要。
- 线上系统还要看写入更新、索引重建、冷热数据管理和高可用能力。
- 很多团队最后并不是“选最强的库”,而是选“最适合现有系统和维护能力的库”。
面试时可以这样答
面试时回答“怎么选”比背某个产品特性更有价值。
常见追问
- Milvus、FAISS、pgvector 这类方案怎么取舍?
- 向量库和搜索引擎能否结合?