LlamaIndex框架中四个核心函数
以下是LlamaIndex框架中四个核心函数(覆盖「数据加载→索引构建→索引持久化→索引复用」完整流程)的汇总解析,包含各函数的功能、细节、代码示例及协同关系:
一、核心函数总览
这四个函数构成了LlamaIndex处理本地文档并构建检索系统的基础链路,依次对应「数据输入→索引创建→索引存储→索引复用」四个关键环节,共同支撑从原始文档到高效查询的全流程:
- A. SimpleDirectoryReader:加载本地文档,转换为框架可处理的结构化数据;
- B. VectorStoreIndex.from_documents:将文档转换为向量索引,实现语义检索能力;
- C. index.storage_context.persist():将构建好的索引持久化到本地,避免重复计算;
- D. load_index_from_storage():从本地加载已保存的索引,直接复用进行查询。
二、各函数详细解析
1. SimpleDirectoryReader —— 本地文档批量加载器
功能:自动识别并加载指定目录下的多格式文件(文本、PDF、Markdown、Word等),转换为LlamaIndex统一的Document对象(含文本内
