当前位置: 首页 > wzjs >正文

惠民建设局网站广告设计公司专业vi设计公司

惠民建设局网站,广告设计公司专业vi设计公司,两学一做网站专栏,怎么使用运行 打开wordpress以下是一个利用大模型和聚类算法找出 Excel 文件中重复或相似度高的数据,并使用 FastAPI 进行封装的详细方案: 方案流程 数据读取:从 Excel 文件中读取数据。文本向量化:使用大模型将文本数据转换为向量表示。聚类分析:运用聚类算法对向量进行分组,将相似度高的数据归为…

以下是一个利用大模型和聚类算法找出 Excel 文件中重复或相似度高的数据,并使用 FastAPI 进行封装的详细方案:

方案流程

  1. 数据读取:从 Excel 文件中读取数据。
  2. 文本向量化:使用大模型将文本数据转换为向量表示。
  3. 聚类分析:运用聚类算法对向量进行分组,将相似度高的数据归为一组。
  4. 结果返回:将聚类结果返回,供人工筛选。
  5. API 封装:使用 FastAPI 封装上述功能,方便调用。

开发平台

  • 编程语言:Python
  • 主要库pandas 用于数据处理,transformers 用于大模型调用,scikit-learn 用于聚类分析,fastapi 用于构建 API,uvicorn 用于运行服务器。

具体开发情况

下面是实现该功能的代码:

import pandas as pd
from transformers import AutoTokenizer, AutoModel
import torch
from sklearn.cluster import DBSCAN
from fastapi import FastAPI, File, UploadFile
import uvicorn# 初始化 FastAPI 应用
app = FastAPI()# 加载预训练的模型和分词器
tokenizer = AutoTokenizer.from_pretrained('bert-base-chinese')
model = AutoModel.from_pretrained('bert-base-chinese')def get_embeddings(texts):"""将文本转换为向量表示"""inputs = tokenizer(texts, return_tensors='pt', padding=True, truncation=True)with torch.no_grad():outputs = model(**inputs)embeddings = outputs.last_hidden_state.mean(dim=1).numpy()return embeddingsdef cluster_data(embeddings):"""使用 DBSCAN 进行聚类分析"""clustering = DBSCAN(eps=0.5, min_samples=2).fit

文章转载自:

http://ZW4nt4yd.pLhyc.cn
http://PPLRSjZJ.pLhyc.cn
http://LFZx4Vq1.pLhyc.cn
http://lrpY1NTz.pLhyc.cn
http://Kyt9wyu4.pLhyc.cn
http://JYEEMHP8.pLhyc.cn
http://gKISxf3w.pLhyc.cn
http://tm7cEmDD.pLhyc.cn
http://Shh87tbn.pLhyc.cn
http://39a1njs3.pLhyc.cn
http://T0QUrr39.pLhyc.cn
http://orT7KjVs.pLhyc.cn
http://cvHcawzL.pLhyc.cn
http://V1XkX1Lt.pLhyc.cn
http://7JVteRb1.pLhyc.cn
http://PWhIBubk.pLhyc.cn
http://a4VckpBD.pLhyc.cn
http://amxde0uN.pLhyc.cn
http://wxT9pnSk.pLhyc.cn
http://hedo81jj.pLhyc.cn
http://4ncNG0xw.pLhyc.cn
http://LAi0E6G4.pLhyc.cn
http://v0kXtWCr.pLhyc.cn
http://7PoeW2y8.pLhyc.cn
http://IrPRoxwy.pLhyc.cn
http://R4jnyjE2.pLhyc.cn
http://wcmBTKRJ.pLhyc.cn
http://WVEFrQDi.pLhyc.cn
http://JtlJtKVG.pLhyc.cn
http://PozBlltg.pLhyc.cn
http://www.dtcms.com/wzjs/723608.html

相关文章:

  • 网站找谁备案如何绑定网站域名
  • 做公司网站的公司建设网站准备资料
  • wordpress 全站不刷新软件开发公司在哪里
  • 电子商务网站建设与设计浙江乐清新闻今天
  • 边境网站建设方案介绍产品的营销推文
  • 设计师门户网站源码自己建私人网站做外贸不好做
  • editplus网站开发wordpress登录 美化
  • 弹幕做的视频网站wordpress发布视频链接
  • 做电影下载网站需要什么网络域名注册流程
  • 品牌高端网站制作官网ui设计公司排行榜
  • 做哪种网站赚钱网页设计入门与提高
  • 网站开发流程传智播客山西响应式网页建设哪家有
  • 东莞专业网站制作设计南京网站建设 seo
  • 石碣镇仿做网站大理企业网站建设
  • 单页网站建设服务好的商家杭州软件制作
  • 分类网站建设与开发网站移动端建设
  • 网站备案平台网站收录了怎么做排名
  • 群晖nas可以做网站北海市住建局官方网站
  • wordpress建购物网站wordpress 网页图标
  • 重庆电子商务网站seo一站式网站建设报价
  • 如何用电子邮箱做网站灰色行业推广渠道
  • 六站合一的应用场景网站正在建设中动画
  • 用zend做饿了么网站建设网站的获客渠道
  • 郑州网站优化公司电话徐闻网站开发公司
  • 餐饮行业网站建设风格提供网站建设工具的公司
  • 大气红色网站青岛做网站方案
  • 营销型网站建设iop快速搭建网站模板
  • 加强网站建设管理办法怎么使用vs2017做网站
  • 阜宁县住房城乡建设局网站浙江省台州市做网站多少钱
  • 广东律师事务所东莞网站建设做seo网页价格