Chroma 是 Rust 内核的开源向量数据库(github.com/chroma-core/chroma,v1.0.0+ 2025-03 重写)。单节点模式用 PersistentClient(SQLite 元数据 + 本地 HNSW 索引)或 EphemeralClient(内存);分布式 / 云模式用 SPANN 索引+ 自研 BLOCKFILE 存储 on S3/GCS。
数据路径:Client Factory → API 层(v1.0.0 起 Rust 默认)→ Segment 层(本地 2 段 / 分布式 3 段)→ Index(HNSW 或 SPANN)→ 持久化。Embed...
Doramagic 晶体页: https://doramagic.ai/zh/crystal/chroma-vector-db
chroma-core/chroma @ commit 598f85f0finance-bp-138Host AI(Claude Code / Cursor / OpenClaw)读 references/seed.yaml,按其中的:
intent_router 匹配用户意图architecture 理解项目架构constraints 应用 anti-pattern 约束business_decisions 参考核心设计决策适合需要向量数据库支持 RAG / 推荐 / 语义搜索的工程师:原型开发用EphemeralClient,本地小规模用 PersistentClient,生产分布式用云SPANN。25+ EmbeddingFunction 一键切换。访问 doramagic.ai/r/chroma 查看完整用例。
SQLite ≥ 3.35.0 是硬要求(chromadb/__init__.py:137-155 检查并 raise,Colab 自动 hot-swap 到 pysqlite3-binary)。Python ≥ 3.9。服务端 / 分布式需要 Rust 工具链或预构建 docker。可选:hosted EF 的 provider API key(OpenAI / Cohere 等)。
本 skill 内置 52 条约束(3 条 fatal)。典型踩坑:(1) cosine 实现实际是 1 - dot(a,b),假定向量预归一化——未归一化数据score 会偏;(2) v1.0.0 Rust 默认静默忽略 4 个旧 Python 设置(chroma_server_nofile 等)——配置文件没报错但不生效;
完整文档: 见 references/seed.yaml (v6.1 schema). 浏览页: https://doramagic.ai/zh/crystal/chroma-vector-db
共 1 个版本
暂无安全检测报告