LangChain其它五类组件详解(6)—— 查询分析(Query analysis)
LangChain其它五类组件详解(6)—— 查询分析(Query analysis)
- 本篇摘要
- 15. LangChain其它五类组件详解
-
- 15.6 查询分析(Query analysis)
-
- 15.6.1 概述
- 15.6.2 查询重写
-
- 1. 优势及方法
- 2. 查询分解示例
- 15.6.3 查询构建
-
- 1. 转化方式及方法
- 2. 元数据过滤器示例
- 参考文献
本章目录如下:
- 《LangChain其它五类组件详解(1)—— 文档加载器(Document loaders)》
- 《LangChain其它五类组件详解(2)—— 文本分割器(Text splitters)》
- 《LangChain其它五类组件详解(3)—— 嵌入模型(Embedding models)》
- 《LangChain其它五类组件详解(4)—— 向量存储(Vector stores)》
- 《LangChain其它五类组件详解(5)—— 检索器(Retrievers)》
- 《LangChain其它五类组件详解(6)—— 查询分析(Query analysis)》
本篇摘要
本章主要详细介绍LangChain的其它五类组件:Document loaders/Text splitters/Embedding models/Vector stores/Retrievers,详细讲解技术细节后给出使用样例。
15. LangChain其它五类组件详解
前面介绍了LangChain的组件Chat models和Tools/Toolkits,本章按照项目中的应用顺序,依次介绍其余四种主要组件Document loaders、Embedding models、Vector stores、Retrievers,再加入非主要但常用的Text splitters,而查询分析(Query analysis)是对Retrievers概念的补充,在讲解原理后对每个组件给出简单示例。
15.6 查询分析(Query analysis)
查询分析(Query analysis)是在检索之前,对查询进行强化以便检索到更多相关信息。本小节作为知识补充,方便读者更全面的了解检索概念。
安全性:这里讨论的一些概念利用模型生成查询(例如用于SQL或图数据库),这样做存在固有风险。请确保您的数据库连接权限尽可能根据应用程序的需求进行限制,这将减轻(尽管不能完全消除)构建能够查询数据库的模型驱动系统的风险。有关一般安全最佳实践的更多信息,请参阅安全指南Security Policy。
15.6.1 概述
检索系统是许多人工智能应用的基础,能够从大型数据集中高效识别相关信息。这些系统适用各种数据格式:
- 非结构化文本:例如文档,通常存储在向量存储或词汇搜索索引中;
- 结构化数据:通常存储在具有定义模式的关系数据库或图数据库中。
检索的关键概念如图:
- 查询分析(Query analysis) :模型通过转换或构建搜索查询以优化检索的过程;
- 信息检索(Information retrieval):使用搜索查询从各种检索系统中获取信息。
上一节已经讲述了信息检索的概念,本节讲述查询分析。尽管数据格式日益多样化,现代人工智能应用越来越希望通过自然语言接口访问所有类型的数据。模型在这一过程中发挥着