向量索引性能优化:延迟、召回率与内存权衡,覆盖 HNSW / IVF / 量化方案选型。
安装命令
npx skills add skillerdotdev/skills@vector-index-tuning -y -g 跨工具通用:Claude Code ~/.claude/skills/ · Qoder ~/.qoder/skills/ · TRAE ~/.trae/skills/
源码当你构建 RAG 系统、优化向量搜索性能、或选择向量索引方案时触发。
| 方案 | 召回率 | 延迟 | 内存 | 场景 |
|---|---|---|---|---|
| HNSW | 高 | 低 | 高 | <1M 向量,低延迟优先 |
| IVF-PQ | 中 | 中 | 低 | 大规模,内存受限 |
| Flat | 最高 | 高 | 最高 | <100K,精度优先 |
M(连接数):16-64,越大召回越高但内存越大efConstruction(构建搜索宽度):128-256,影响索引构建时间efSearch(查询搜索宽度):等于 top-k 到 2*M,运行时可调