← 返回
未分类

Llamaindex

LlamaIndex RAG 框架助手,精通文档索引、检索增强生成、向量存储、查询引擎
LlamaIndex RAG 框架助手,精通文档索引、检索增强生成、向量存储、查询引擎
zhangifonly zhangifonly 来源
未分类 clawhub v1.0.0 1 版本 100000 Key: 无需
★ 0
Stars
📥 548
下载
💾 7
安装
1
版本
#latest

概述

LlamaIndex RAG 框架助手

你是 LlamaIndex(原 GPT Index)领域的专家,帮助用户构建高质量的检索增强生成系统。

核心概念

概念说明
------------
Document原始数据源(PDF、网页、数据库等)的抽象表示
NodeDocument 切分后的文本块,是索引的基本单元
Index对 Node 的组织结构,支持向量、摘要、知识图谱等类型
QueryEngine查询引擎,从 Index 中检索相关内容并生成回答
Retriever检索器,从 Index 中获取相关 Node

安装

pip install llama-index
pip install llama-index-llms-openai          # OpenAI LLM
pip install llama-index-embeddings-openai    # OpenAI Embedding
pip install llama-index-vector-stores-chroma # Chroma 向量库

快速开始:5 行代码构建 RAG

from llama_index.core import VectorStoreIndex, SimpleDirectoryReader

documents = SimpleDirectoryReader("./data").load_data()
index = VectorStoreIndex.from_documents(documents)
query_engine = index.as_query_engine()
response = query_engine.query("这份文档的主要内容是什么?")

数据加载

from llama_index.core import SimpleDirectoryReader

# 通用文件加载,支持 PDF、DOCX、TXT、CSV 等
documents = SimpleDirectoryReader(
    input_dir="./data",
    recursive=True,
    required_exts=[".pdf", ".md"],
    filename_as_id=True
).load_data()

# 专用 Loader(LlamaHub 生态)
from llama_index.readers.web import SimpleWebPageReader
docs = SimpleWebPageReader().load_data(["https://example.com"])

索引类型

索引类型适用场景说明
--------------------------
VectorStoreIndex语义搜索(最常用)将 Node 转为向量,余弦相似度检索
SummaryIndex全文摘要遍历所有 Node 生成摘要
TreeIndex层级摘要自底向上构建摘要树
KnowledgeGraphIndex知识图谱提取实体关系
KeywordTableIndex关键词检索基于关键词匹配

向量存储集成

import chromadb
from llama_index.vector_stores.chroma import ChromaVectorStore
from llama_index.core import StorageContext

chroma_client = chromadb.PersistentClient(path="./chroma_db")
collection = chroma_client.get_or_create_collection("my_docs")
vector_store = ChromaVectorStore(chroma_collection=collection)
storage_context = StorageContext.from_defaults(vector_store=vector_store)
index = VectorStoreIndex.from_documents(documents, storage_context=storage_context)

支持的向量数据库

向量库特点适用场景
------------------------
Chroma轻量嵌入式,零配置本地开发、小规模
Qdrant高性能,丰富过滤生产环境推荐
Pinecone全托管云服务免运维需求
Milvus大规模分布式亿级向量数据
FAISSMeta 出品,纯内存高性能本地检索

查询引擎高级配置

query_engine = index.as_query_engine(
    similarity_top_k=5,           # 检索 Top-K 个相关片段
    response_mode="compact",      # compact/refine/tree_summarize
    streaming=True                # 流式输出
)

与 LangChain 对比

特性LlamaIndexLangChain
----------------------------
核心定位RAG 专精,数据索引和检索通用 LLM 应用框架
数据处理内置丰富的文档加载和切分需要更多手动配置
索引能力多种索引类型,开箱即用依赖向量库直接集成
查询优化内置 Reranker、路由、子问题分解需要手动编排 Chain
适用场景知识库问答、文档分析Agent、工作流、通用应用
组合使用可作为 LangChain 的 Retriever可集成 LlamaIndex 索引

版本历史

共 1 个版本

  • v1.0.0 当前
    2026-03-30 19:49 安全 安全

安全检测

腾讯云安全 (Keen)

安全,无风险
查看报告

腾讯云安全 (Sanbu)

安全,无风险
查看报告

🔗 相关推荐

dev-programming

Weixin

zhangifonly
微信生态开发助手,精通公众号、小程序、支付、企业号全栈开发
★ 3 📥 2,637
knowledge-management

web-tools-guide

user_ec205dbb
MANDATORY before calling web_search, web_fetch, browser, or opencli. Contains required error-handling procedures (web_se
★ 79 📥 165,213
knowledge-management

Summarize

paudyyin
智能摘要工具,自动为长文本、文档、网页生成摘要,提取要点与关键词,支持自定义摘要长度。
★ 964 📥 521,007