当前位置: 首页 > wzjs >正文

自己做的网站 能收索么模板建站流程

自己做的网站 能收索么,模板建站流程,电商的推广主要是做什么的,自己做视频网站能赚钱吗chroma 一步步使用 安装 # 安装chromadb pip install chromadb,sentence_transformers# 不启动服务会出现sock.connect(sa)TimeoutError: timed out chroma run服务启动后,您将看到类似以下输出: 建立连接 部署完成后,需要建立与Chroma服…

chroma 一步步使用

安装

# 安装chromadb
pip install chromadb,sentence_transformers# 不启动服务会出现sock.connect(sa)TimeoutError: timed out
chroma run

服务启动后,您将看到类似以下输出:
在这里插入图片描述

建立连接

部署完成后,需要建立与Chroma服务的连接:

import chromadb# 创建了临时客户端。程序终止时,您提取的任何数据都会丢失
client = chromadb.Client()

创建向量集合

chroma连接若直接创建集合(“Collection”(集合)是存储向量的基本单位,类似于关系型数据库中的表),会使用内置的嵌入模型all-MiniLM-L6-v2

# 首先导入embedding模型
from chromadb.utils import embedding_functionscollection = chroma_client.create_collection(name="my_collection")
collection.add(documents=["关于深度学习技术的文档","关于的爱情小说文档"],ids=["id1", "id2"]
)
print(collection)

chroma默认使用欧氏距离计算向量相似度

查询文档

Chroma提供多种查询方式,满足不同场景需求:

1. 基于ID查询

当你知道确切的文档ID时,可以直接查询:

# 根据ID获取文档
result = collection.get(ids=["id1"]
)
2. 语义向量检索

RAG系统的核心功能是语义检索,基于查询与文档的语义相似度:

# 语义检索
# Chroma 默认会返回 10 条结果。这里我们只添加了 2 个文档,因此我们设置n_results=2
results = collection.query(query_texts=["如何使用向量数据库?"],n_results=2
)
print(results)

工程中优化

混合检索

Chroma还支持将全文匹配与向量检索结合:

# 全文匹配 + 向量检索
results = collection.query(query_texts=["检索技术的应用"],n_results=2,where_document={"$contains": "检索"},  # 文档必须包含"检索"一词include=["documents", "metadatas"]
)

Chroma支持将向量检索与元数据过滤结合,实现更精准的查询:

# 元数据过滤 + 向量检索
results = collection.query(query_texts=["大语言模型的应用"],n_results=2,where={"topic": "llm"},  # 仅检索topic为llm的文档include=["documents", "metadatas"]
)

元数据过滤支持多种操作符:

  • 相等:{"field": value}
  • 不等:{"field": {"$ne": value}}
  • 大于/小于:{"field": {"$gt": value}}{"field": {"$lt": value}}
  • 范围:{"field": {"$gte": min_value, "$lte": max_value}}
  • 复合条件:{"$and": [condition1, condition2]}
调参:索引与性能优化

Chroma默认使用HNSW(分层可导航小世界图)作为向量索引算法,无需手动创建索引。但你可以通过元数据调整索引参数:

# 创建集合时设置HNSW参数
collection = client.create_collection(name="optimized_collection",embedding_function=embedding_func,metadata={"hnsw:space": "cosine",       # 相似度度量方式"hnsw:M": 16,                 # 每个节点的最大连接数"hnsw:ef_construction": 200,  # 构建索引时的搜索宽度"hnsw:ef": 100                # 查询时的搜索宽度}
)

关键参数解释:

  • M:控制图的连接度,值越大精度越高但内存消耗也越大
  • ef_construction:影响索引质量,值越大精度越高但构建速度越慢
  • ef:影响查询精度和速度,值越大召回率越高但查询速度越慢
http://www.dtcms.com/wzjs/219555.html

相关文章:

  • 罗湖网站设计公司哪家好宁德市人力资源和社会保障局
  • 浙江省建设部网站好的搜索引擎推荐
  • 什么是网站建设中的专用主机如何在网上推广产品
  • 天涯武汉论坛武汉外包seo公司
  • 河南省建设监理协会网站证书查询临沂百度代理公司有几个
  • 联享品牌网站建设网络优化培训
  • 番禺网站建设制作网站建设黄页在线免费
  • 用什么网站做cpa武汉seo首页优化技巧
  • 杭州大江东建设局网站爱站关键词
  • 莱州教体局网站软文广告经典案例
  • 帮助赌博网站做优化百度扫一扫识别图片
  • 图片素材网站排行榜整合营销策略
  • 上海网站建设做物流一企业培训考试app
  • 日本做a爱片视频网站全国疫情实时资讯
  • 好用的外贸网站百度电商推广
  • 网站定制公司地址关键词优化的最佳方法
  • 网站建设与网页设计 视频舆情监测软件免费版
  • 西宁建设网站百度产品有哪些
  • 做彩票网站需要学习什么大搜推广
  • 与企业网站做接口一站式营销推广
  • 推动品牌建设的网站ip软件点击百度竞价推广
  • 蛋糕店微网站引擎优化是什么工作
  • 高明网站建设公司关键词歌词任然
  • 网站会员管理便民信息微信平台推广
  • 公司的网站续费网络推广网站有哪些
  • 做网站的女生多么百度应用app下载
  • 手机qq邮箱发布了wordpress重庆seo的薪酬水平
  • 做网站什么语言合肥做网站哪家好
  • 幕墙配件在那个网站做推广好软文广告300字范文
  • 怎样用wordpress搭建网站国内打开google网页的方法