当前位置: 首页 > wzjs >正文

上市公司查询网站网络舆情分析

上市公司查询网站,网络舆情分析,包装设计培训,云服务器做网站新手教程elasticsearchsentencetransformer结合实现搜索确实效率很高,但是跟着官方版本进行操作会有很多的误区,小编踩了很多坑才得到一版不报错的代码,感兴趣的小伙伴可以运行一下玩玩。 在开始前需要做一些准备工作: 一、准备工作 1、…

elasticsearch+sentencetransformer结合实现搜索确实效率很高,但是跟着官方版本进行操作会有很多的误区,小编踩了很多坑才得到一版不报错的代码,感兴趣的小伙伴可以运行一下玩玩。
在开始前需要做一些准备工作:

一、准备工作

1、脚本中用到了elasticsearch、sentence_transformers,需要先行安装

这里我用的elasticsearch版本是8.8.1,不同版本可能会有所差异

pip install elasticsearch
pip install sentence_transformers

2、在运行代码前需要先行启动elasticsearch,出现以下类似的页面

在这里插入图片描述

3、在https://hf-mirror.com/中找到对应的模型

我在这里使用到的是all-MiniLM-L6-v2

4、准备待搜索的文档

官方文档提供的数据集引入方式是load_dataset,这个是下载现成的datasets来使用,但是我发现很难找到对应的数据集,所以我自己做了一个,其实很简单的csv文档,这样你可以方便的使用你的数据来替换搜索的内容
在这里插入图片描述

二、具体实现代码

from elasticsearch import Elasticsearch
from sentence_transformers import SentenceTransformer
import csv# 配置参数
ES_HOST = "http://localhost:9200"
MODEL_PATH = "E:/all/pythonProject/2025srt/models/sentence-transformers/all-MiniLM-L6-v2" #将模型替换为你的模型对应的位置
CSV_PATH = "E:/all/pythonProject/2025srt/ess/quora/quornew.csv" #替换为你需要的路径和名字
INDEX_NAME = "quora_questions"  # 确保与后续查询一致# 初始化连接和模型
es = Elasticsearch(ES_HOST)
model = SentenceTransformer(MODEL_PATH)# 步骤1:创建包含 dense_vector 的索引
if not es.indices.exists(index=INDEX_NAME):index_settings = {"mappings": {"properties": {"text_vector": {"type": "dense_vector",  # 关键修正点"dims": 384,              # all-MiniLM-L6-v2 的向量维度是384"index": True,           # 启用kNN索引"similarity": "cosine"   # 根据模型选择相似度算法},"id": {"type": "integer"},"text": {"type": "text"}}}}es.indices.create(index=INDEX_NAME, body=index_settings)# 步骤2:索引数据(处理BOM字符问题)
with open(CSV_PATH, newline='', encoding='utf-8-sig') as csvfile:  # 使用utf-8-sig处理BOMreader = csv.DictReader(csvfile)for row in reader:doc_id = int(row['id'])  # 修正BOM导致的字段名问题text = row['text']# 生成向量text_vector = model.encode(text).tolist()# 构建文档document = {"id": doc_id,"text": text,"text_vector": text_vector}# 写入ESes.index(index=INDEX_NAME, id=doc_id, document=document)print(f"数据已索引到 {INDEX_NAME}")# 步骤3:执行kNN查询(修正查询结构)
query_text = "What is the meaning of democracy?"
query_vector = model.encode(query_text).tolist()# 修正后的查询体
search_body = {"knn": {"field": "text_vector","query_vector": query_vector,"k": 5,"num_candidates": 100},"_source": ["text", "id"]  # 返回字段
}
# knn:从海量数据中‌快速找出与目标向量最接近的 k 个结果
try:response = es.search(index=INDEX_NAME, body=search_body)  # 关键修正:使用body参数print("搜索结果:")for hit in response['hits']['hits']:print("查找对象:" + query_text)print(f"ID: {hit['_id']}, Score: {hit['_score']:.4f}")print(f"Text: {hit['_source']['text']}\n")
except Exception as e:print(f"查询失败: {str(e)}")

结果:找到了五条相似的内容
在这里插入图片描述

三、官方文档

Elasticsearch:语义搜索 - Semantic Search in python


文章转载自:

http://akuEOt0t.pcgrq.cn
http://HMeeAKo5.pcgrq.cn
http://GzrXofVp.pcgrq.cn
http://GiCQUw3Q.pcgrq.cn
http://C7uDc8im.pcgrq.cn
http://Okry8GDU.pcgrq.cn
http://cfHw1dqH.pcgrq.cn
http://orNZUjN5.pcgrq.cn
http://IRr6XYBv.pcgrq.cn
http://mCJMoQu3.pcgrq.cn
http://taXHC2CQ.pcgrq.cn
http://e4ZekeU2.pcgrq.cn
http://9izRJxJu.pcgrq.cn
http://8f6cPFpO.pcgrq.cn
http://EPvM06Mr.pcgrq.cn
http://pCNAo693.pcgrq.cn
http://JaHfP5vB.pcgrq.cn
http://YFiLntbI.pcgrq.cn
http://HWhhAkQu.pcgrq.cn
http://TMQGVVfZ.pcgrq.cn
http://s0dOat8x.pcgrq.cn
http://iY6iRZew.pcgrq.cn
http://55qY5Eek.pcgrq.cn
http://GZyNisdT.pcgrq.cn
http://pIfHUe4e.pcgrq.cn
http://vk35E5MM.pcgrq.cn
http://AW2SiPmm.pcgrq.cn
http://WlhkDg0u.pcgrq.cn
http://6BxvEBNg.pcgrq.cn
http://Kn2GozNd.pcgrq.cn
http://www.dtcms.com/wzjs/740792.html

相关文章:

  • 山西建设网站公司瑞安机械网站建设
  • 如何架设个人网站公司logo墙设计图片
  • 网站分页效果企业seo可以达到怎样的效果
  • 在家帮别人做网站赚钱一个网站做三个关键词
  • 做个产品网站要多少钱中国十大电商平台
  • 精美旅游网站案例cfensi.wordpress
  • 嘉兴网站建设托管做个网站大约多少钱
  • 开发公司总工岗位职责郑州seo代理公司
  • 西安网站建设需要多少钱网站Api接口怎么做
  • apache搭建wordpress长春做网站优化哪家好
  • 云南省建设厅网站处长旧电脑做php网站服务器
  • 手机免费注册网站官方网站建站
  • 想要黑掉一个网站 要怎么做php cms网站建设
  • 安装多个wordpress站点中国建设网app
  • 做方案收集图片的网站c# 网站开发框架
  • 网站跟信息推广有哪些信息化建设深圳遗像制作
  • 电子商务网站建设教程试卷东阳市网站建设制作
  • 手机网站被自动跳转html手机网站
  • 简单网站首页怎么做用xp做网站是否先搭建iis
  • 挂马网站教程益阳建设企业网站
  • 山东省建设监理协会网站6做团建活动网站
  • 企业建设网站的步骤使用wordpress建立个人网站
  • 网站建设的步骤以及流程网站开发开题报告
  • 浙江网站建设上市公司网页设计师联盟qq
  • 河北建设厅网站技术电话卖汽车配件怎么做网站
  • html做的旅游网站wordpress 4.5.3中
  • 网站域名背景拖拽响应式网站建设公司
  • asp.net 4.0网站开发搜索引擎营销是什么意思
  • 开发做一个网站的流程西安市房产信息查询平台官网
  • 网站如何合理建设seo网站平台项目交接需要什么