大模型——使用 StarRocks 作为向量数据库
大模型——使用 StarRocks 作为向量数据库
本章节介绍了 StarRocks,这是一款高性能的分析数据库,并演示了如何将其用作向量数据库。内容涵盖了设置、文档加载、标记化、创建向量数据库实例以及构建一个能够检索的问答系统。
StarRocks
StarRocks 是一个次世代的亚秒级 MPP 数据库,适用于全分析场景,包括多维分析、实时分析和即席查询。通常,StarRocks 被归类为 OLAP(联机分析处理),并且在 ClickBench — 一个分析数据库管理系统的基准测试中表现出色。由于其超快的向量化执行引擎,它也可以作为快速的向量数据库使用。
设置
首先,用户需要安装必要的库。在 Python 环境中,用户可以使用以下命令进行安装:
%pip install --upgrade --quiet pymysql langchain-community
设置 update_vectordb = False
,如果没有文档更新,则无需重建文档的嵌入。
from langchain.chains import RetrievalQA
from langchain_community.document_loaders im