当前位置: 首页 > news >正文

网站ftp上传到空间固定ip 建网站

网站ftp上传到空间,固定ip 建网站,2022最新英雄合击手游,网站背景修改1. 数据的导入 Pinecone 与 Faiss 类似,提供了 from_texts 和 from_documents 方法,支持快速从文本列表和文档列表中构建向量数据库。此外,还可以通过构造函数实例化 Pinecone 向量数据库后,使用 add_texts 方法添加数据。 在配…

1. 数据的导入

Pinecone 与 Faiss 类似,提供了 from_textsfrom_documents 方法,支持快速从文本列表和文档列表中构建向量数据库。此外,还可以通过构造函数实例化 Pinecone 向量数据库后,使用 add_texts 方法添加数据。

在配置好 Index(例如 llmops)、namespace(例如 dataset)和 api_key 后,可以执行以下代码来完成向量数据库数据的添加:

import dotenv
from langchain_openai import OpenAIEmbeddings
from langchain_pinecone import PineconeVectorStoredotenv.load_dotenv()embedding = OpenAIEmbeddings(model="text-embedding-3-small")
db = PineconeVectorStore(index_name="test_name", embedding=embedding, namespace="dataset")
db.add_texts(["笨笨是一只很喜欢睡觉的猫咪","我喜欢在夜晚听音乐,这让我感到放松。","猫咪在窗台上打盹,看起来非常可爱。","学习新技能是每个人都应该追求的目标。","我最喜欢的食物是意大利面,尤其是番茄酱的那种。","昨晚我做了一个奇怪的梦,梦见自己在太空飞行。","我的手机突然关机了,让我有些焦虑。","阅读是我每天都会做的事情,我觉得很充实。","他们一起计划了一次周末的野餐,希望天气能好。","我的狗喜欢追逐球,看起来非常开心。",
], [{"page": 1},{"page": 2},{"page": 3},{"page": 4},{"page": 5},{"page": 6, "account_id": 1},{"page": 7},{"page": 8},{"page": 9},{"page": 10},
], namespace="dataset")print(db.similarity_search_with_relevance_scores("我养了一只猫,叫笨笨"))

请确保在实际应用中替换 your_api_key、llmops、dataset 和 texts 为适合您项目的数据。
输出内容

[(Document(page_content='笨笨是一只很喜欢睡觉的猫咪', metadata={'page': 1.0}), 0.8095565), (Document(page_content='猫咪在窗台上打盹,看起来非常可爱。', metadata={'page': 3.0}), 0.7276270835), (Document(page_content='我的狗喜欢追逐球,看起来非常开心。', metadata={'page': 10.0}), 0.6540447475), (Document(page_content='我的手机突然关机了,让我有些焦虑。', metadata={'page': 7.0}), 0.611671284)]

资料推荐

  • 💡大模型中转API推荐
  • ✨中转使用教程

2. 带过滤的相似性搜索

Faiss 不同,Pinecone 支持原生的带过滤的相似性检索功能(元数据筛选),使用元数据过滤器会精确检索与过滤器匹配的最临近结果数,在 Pinecone 中,过滤器格式为 json,其中 键 是元数据字段对应字符串,值 是 字符串、数字、布尔值、列表、json 中的一种。

例如下方是精确筛选的过滤器:

{"genre": "action","year": 2020,"length_hrs": 1.5
}{"color": "blue","fit": "straight","price": 29.99,"is_jeans": true
}

除此之外,筛选器的值还可以传递 json 数据,用于支持更加复杂的条件搜索,而且还可以和 AND/OR 配合

3. 筛选条件

Pinecone 提供了一系列筛选条件,用于根据元数据值进行向量匹配。以下是支持的条件及其描述:

筛选条件描述支持的类型
$eq匹配元数据值等于指定值的向量数字、字符串、布尔值
$ne匹配元数据值不等于指定值的向量数字、字符串、布尔值
$gt匹配元数据值大于指定值的向量数字
$gte匹配元数据值大于或等于指定值的向量数字
$lt匹配元数据值小于指定值的向量数字
$lte匹配元数据值小于或等于指定值的向量数字
$in将向量与指定数组中的元数据值进行匹配字符串、数字
$nin与不在指定数组中的元数据值的向量匹配字符串、数字
$exists与存在/不存在特定元数据值的向量匹配布尔值
$and多个条件同时符合-
$or多个条件只需要满足一个-

这些筛选条件可以帮助用户在查询时根据具体需求过滤出符合某些标准的向量。
例如检索页数小于等于 5 页的数据,代码示例:

import dotenv
from langchain_openai import OpenAIEmbeddings
from langchain_pinecone import PineconeVectorStoredotenv.load_dotenv()embedding = OpenAIEmbeddings(model="text-embedding-3-small")
db = PineconeVectorStore(index_name="llmops", embedding=embedding, namespace="dataset")resp = db.similarity_search_with_relevance_scores("我养了一只猫叫笨笨",filter={"page": {"$lte": 5}}
)

输出内容

[(Document(page_content='笨笨是一只很喜欢睡觉的猫咪', metadata={'page': 1.0}), 0.8121996819999999), (Document(page_content='猫咪在窗台上打盹,看起来非常可爱。', metadata={'page': 3.0}), 0.7371905), (Document(page_content='我喜欢在夜晚听音乐,这让我感到放松。', metadata={'page': 2.0}), 0.5996375455), (Document(page_content='我最喜欢的食物是意大利面,尤其是番茄酱的那种。', metadata={'page': 5.0}), 0.5745788215000001)]

例如下方,在 page=5 并且 account_id=1 的向量数据里进行相似性检索:

resp = db.similarity_search_with_relevance_scores("我养了一只猫叫笨笨",filter={"$and": [{"page": 5}, {"account_id": 1}]}
)# 输出,没有符合条件的数据
[]

改成 $or 则为符合其中一个条件即可:

resp = db.similarity_search_with_relevance_scores("我养了一只猫叫笨笨",filter={"$or": [{"page": 5}, {"account_id": 1}]}
)# 输出
[(Document(page_content='我最喜欢的食物是意大利面,尤其是番茄酱的那种。', metadata={'page': 5.0}), 0.574801199), (Document(page_content='昨晚我做了一个奇怪的梦,梦见自己在太空飞行。', metadata={'account_id': 1.0, 'page': 6.0}), 0.5700240435)]

关于 Pinecone 更详细的筛选用法文档:https://docs.pinecone.io/guides/data/filter-with-metadata

4. 删除指定数据

Pinecone 向量数据库中同样支持删除数据,并且支持按照 id列表、按照命名空间删除全部数据、条件删除 等多种策略,delete() 函数参数如下:

  1. ids:需要删除的 id 列表,非必填参数。
  2. delete_all:是否删除全部数据,一般结合 namespace 一起使用,代表删除命名空间内的所有数据,非必填参数。
  3. namespace:需要删除的命名空间数据,非必填参数。
  4. filter:过滤器,格式为 json/dict,删除符合条件的所有数据,在无服务器索引的情况下,不支持通过元数据筛选器删除对应的数据,只在 Pod 索引下支持,检索器的用法和相似性搜索一模一样。
    例如,删除 id=21c694f3-1e12-47b5-af9d-c93de29ad093 对应的向量数据,如下:
db.delete(["21c694f3-1e12-47b5-af9d-c93de29ad093"])

关于 Pineone 删除数据的用法文档:https://docs.pinecone.io/guides/data/delete-data
资料推荐

  • 💡大模型中转API推荐
  • ✨中转使用教程

5. 获取原始实例

如果 LangChain 封装的 VectorStore 对应的方法并不能满足相应的需求,一般情况下,还可以获取到向量数据库的原始实例,例如 Pinecone 提供了 update 方法,但是在 LangChain 封装的 PineconeVectorStore 并没有提供这个方法,所以可以考虑从原始实例上调用该方法。

可以通过 .get_pinecone_index() 函数来获取对应的 Index,从而进行相应的操作:

llmops_index = db.get_pinecone_index("llmops")llmops_index.update(id="xxx", values=[xxx], namespace="dataset")

关于原始实例操作数据的相关文档:https://docs.pinecone.io/guides/data/upsert-data

http://www.dtcms.com/a/559331.html

相关文章:

  • 免费做电脑网站吗高校门户网站建设
  • 珠海网站策划公司扬州公司做网站
  • 网站关键词布局互联网营销师报名入口官网
  • 网站建设是属于软件开发费吗wordpress 蜘蛛
  • 最牛的手机视频网站建设长安网站建设公司
  • 河北省网站快速备案优的网站建设明细报价表
  • 怎样建立网站目录结构江门网站建设套餐
  • 哪里有网站建设培训班wordpress首页缩略图大小
  • 做3d ppt模板下载网站有哪些网站开发框架 简单
  • 住房城乡建设部 网站net网站开发手机网站
  • 手机销售网站模板wordpress dux 下载
  • 网站设计小技巧网站列表页内容
  • gta5网站显示建设中房产中介 网站开发
  • 建构网站西安随州北京网站建设
  • windriver 快速生成PCIE驱动文件
  • 做网站虚拟服务器网站建设如何找客户
  • .net怎么做网站网站开发开题报告范文
  • seo三人行网站网页制作软件推荐
  • 有哪些做品牌特卖的网站数字域名做网站
  • 网站开发软件、彩票网站链接怎么做
  • 福州网站营销wordpress商店网页
  • 个人姓名最多备案多少个网站ssh蒙语网站开发
  • 请求php网站数据库html注册登录模板
  • 安徽建设工程协会网站网站域名已经解析但没有被百度等搜索引擎收录怎么办
  • 鞍山网站制作公司wordpress修改模块样式
  • 网站开发技术规范wordpress静态生成器
  • 青海西宁制作网站公司佛山网约车驾驶员资格证网上报名
  • 各大门户网站网线制作图解
  • 网站内容设计基本原则设计iphone手机网站
  • 沂南网站建设铜梁旅游网站建设管理