当前位置: 首页 > wzjs >正文

做网站 分辨率应该是多少南阳网网站建设

做网站 分辨率应该是多少,南阳网网站建设,有没有做公司网站的,网络营销方案策划论文🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 | 接辅导、项目定制 一、我的环境 1.语言环境:Python 3.8 2.编译器:Pycharm 3.深度学习环境: torch1.12.1cu113torchvision…
  • 🍨 本文为🔗365天深度学习训练营 中的学习记录博客
  • 🍖 原作者:K同学啊 | 接辅导、项目定制

一、我的环境

1.语言环境:Python 3.8

2.编译器:Pycharm

3.深度学习环境:

  • torch==1.12.1+cu113
  • torchvision==0.13.1+cu113

安装Gensim库

pip install gensim

对原始语料分词

选择《人民的名义》的小说原文作为语料,先采用jieba进行分词。这里是直接添加的自定义词汇,没有选择创建自定义词汇文件。

import jieba.analysejieba.suggest_freq('沙瑞金', True)  # 加入一些词,使得jieba分词准确率更高
jieba.suggest_freq('田国富', True)
jieba.suggest_freq('高育良', True)
jieba.suggest_freq('侯亮平', True)
jieba.suggest_freq('钟小艾', True)
jieba.suggest_freq('陈岩石', True)
jieba.suggest_freq('欧阳菁', True)
jieba.suggest_freq('易学习', True)
jieba.suggest_freq('王大路', True)
jieba.suggest_freq('蔡成功', True)
jieba.suggest_freq('孙连城', True)
jieba.suggest_freq('季昌明', True)
jieba.suggest_freq('丁义珍', True)
jieba.suggest_freq('郑西坡', True)
jieba.suggest_freq('赵东来', True)
jieba.suggest_freq('高小琴', True)
jieba.suggest_freq('赵瑞龙', True)
jieba.suggest_freq('林华华', True)
jieba.suggest_freq('陆亦可', True)
jieba.suggest_freq('刘新建', True)
jieba.suggest_freq('刘庆视', True)
jieba.suggest_freq('赵德汉', True)
with open('./data.txt', encoding='utf-8') as f:result_cut = []lines = f.readlines()for line in lines:result_cut.append(list(jieba.cut(line)))f.close()

结果:

Building prefix dict from the default dictionary ...
Loading model from cache C:\Users\ldq\AppData\Local\Temp\jieba.cache
Loading model cost 0.313 seconds.
Prefix dict has been built successfully.

添加自定义停用词

stopwords_list = [",", "。", "\n", "\u3000", " ", ":", "!", "?","…"]  # \u3000 是一个 Unicode 编码的字符,它代表一个全角的空白字符,通常在中文文本中用作空格。def remove_stopwords(ls):  # 去除停用词return [word for word in ls if word not in stopwords_list]result_stop = [remove_stopwords(x) for x in result_cut if remove_stopwords(x)]
print(result_stop[100:103])

结果:

[['侯亮平', '也', '很', '幽默', ',', '一把', '抓住', '了', '赵德汉', '的', '手', ':', '哎', ',', '赵', '处长', ',', '我', '既', '来', '了', '还', '真', '舍不得', '和', '你', '马上', '就', '分手', '哩', '!', '咱们', '去', '下', '一个点', '吧', '!', '说', '罢', ',', '从', '赵家', '桌上', '杂物', '筐', '里', '准确', '地', '拿出', '一张', '白色', '门卡', ',', '插到', '了', '赵德汉', '的', '上衣', '口袋', '里'], ['赵德汉', '慌', '了', ',', '忙', '把门', '卡往', '外', '掏', ':', '这', '这', '什么', '呀', '这', '是', '?'], ['你', '帝京', '苑', '豪宅', '的', '门', '卡', '啊', '!', '请', '继续', '配合', '我们', '执行公务', '吧', '!']]

训练Word2Vec模型

from gensim.models import Word2Vecmodel = Word2Vec(result_stop,  # 用于训练的语料数据vector_size=100,  # 是指特征向量的维度,默认为100window=5,  # 一个句子中当前单词和被预测单词的最大距离min_count=1)  # 可以对字典做截断,词频少于min_count次数的单词会被丢弃掉,默认值为5

模型应用

num_class  = len(label_name)
vocab_size = len(vocab)
em_size    = 64
model      = TextClassificationModel(vocab_size, em_size, num_class).to(device)

1.计算词汇相似度

print(model.wv.similarity('沙瑞金', '季昌明'))
print(model.wv.similarity('沙瑞金', '田国富'))
for e in model.wv.most_similar(positive=['沙瑞金'], topn=5):print(e[0], e[1])

结果:

0.99802387
0.99903405

李达康 0.9997692108154297
情况 0.9997009634971619
欧阳菁 0.9996625781059265
又 0.9995917677879333
学生 0.9995916485786438 

2.找出不匹配的词汇

odd_word = model.wv.doesnt_match(["苹果", "香蕉", "橙子", "书"])
print(f"在这组词汇中不匹配的词汇:{odd_word}")

 结果:

在这组词汇中不匹配的词汇:书

3.计算词汇的词频

word_frequency = model.wv.get_vecattr("沙瑞金", "count")
print(f"沙瑞金:{word_frequency}")

结果:沙瑞金:353 


文章转载自:

http://HrdrriUG.jqsyp.cn
http://iaH594R6.jqsyp.cn
http://7IUoIgMp.jqsyp.cn
http://7sYtBYWM.jqsyp.cn
http://PPPOPaNB.jqsyp.cn
http://kYxULoEi.jqsyp.cn
http://5p4JMTfg.jqsyp.cn
http://8O9Cvt0k.jqsyp.cn
http://NCEhNYSQ.jqsyp.cn
http://H6nioMXL.jqsyp.cn
http://J4VKScEk.jqsyp.cn
http://UE9P8p6A.jqsyp.cn
http://77oPJMFp.jqsyp.cn
http://3SMvXE3d.jqsyp.cn
http://Rng6XMfH.jqsyp.cn
http://l49HjoH2.jqsyp.cn
http://2coZWUZr.jqsyp.cn
http://Yuy0MCkn.jqsyp.cn
http://arEkWhYQ.jqsyp.cn
http://uUa61Edz.jqsyp.cn
http://nen930k0.jqsyp.cn
http://cybkRebV.jqsyp.cn
http://fP1XaLL4.jqsyp.cn
http://PbPmvMyI.jqsyp.cn
http://tEYbNXBR.jqsyp.cn
http://H4FNaMeT.jqsyp.cn
http://Y5jnKpk2.jqsyp.cn
http://nGhOJ8Oh.jqsyp.cn
http://vWS8j9fb.jqsyp.cn
http://eafU9hVZ.jqsyp.cn
http://www.dtcms.com/wzjs/714914.html

相关文章:

  • 网站优化应该怎么做云伙伴小程序开发公司
  • 邯郸移动网站建设报价城阳网站制作
  • 济宁网站建设 优化培训网站硬件建设方案
  • 万维网站续费多少一年网页版梦幻西游金色伙伴推荐
  • 产品网站定制汕头有几个区
  • 怎样建设网站北京公司注册地址多少钱一年
  • 做的网站没法本地上传图片白云百度seo公司
  • 在线网站分析工具中国站长
  • 网站建设wesnowsat怎么做网站 高中信息技术
  • 帮熟人做网站如何收费济南哪家做网站
  • 石河子网站设计郑州营销网站托管
  • 企业为什么要建设网站南充网站建设服务商
  • 网站背景图片素材 唯美搜狗站长平台验证网站
  • 网站广告图做多大如何做个网站做cpa
  • 盐山国外网站建设湘潭关键词优化公司
  • 怎么用ftp修改网站保定模板建站平台
  • wordpress 移动端优势win7一键优化工具
  • 网站新年特效discuz论坛
  • 为什么要选择高端网站定制网站建设前准备
  • 博客内容跟网站相关吗深圳做网站的网络
  • 中国网站建设20强网络营销推广方法有
  • 外贸怎么做网站外链购买网站设计制作
  • 建设优质网站需要什么泰州网站建设案例
  • 成都制作网站公司哪家好无需下载即可观看网页
  • 四川省城镇建设二次供水网站南京尔顺科技发展有限公司表扬信息怎么做公众号
  • 昆山高端网站设计建设企业网站建设推广合同
  • 手机网站开发html网站怎么做切换图片
  • 建设网站需要哪些人员长春市
  • 沈阳模板建站小程序怎么推广运营
  • 凡科 如何建设网站流程公司网站域名到期