当前位置: 首页 > wzjs >正文

安徽省建设安全监督站的网站企业网站系统详细设计

安徽省建设安全监督站的网站,企业网站系统详细设计,wordpress调用视频,凡科网站建设套餐报价一、自然语言概述 自然语言处理研究的主要是通过计算机算法来理解自然语言。对于自然语言来说,处理的数据主要就是人类的语言,该类型的数据不像我们前面接触的结构化数据或图像数据可以很方便的进行数值化 二、词嵌入层 词嵌入层的作用就是将文本转换为向…

一、自然语言概述

  • 自然语言处理研究的主要是通过计算机算法来理解自然语言。对于自然语言来说,处理的数据主要就是人类的语言,该类型的数据不像我们前面接触的结构化数据或图像数据可以很方便的进行数值化

二、词嵌入层

  • 词嵌入层的作用就是将文本转换为向量,词嵌入层首先会根据输入的词的数量构建一个词向量矩阵,例如:我们有5个词,每个词希望转换成3维度的向量,那么构建的矩阵的形状即为5*3,输入的每个词都对应了一个该矩阵中的一个向量

在Pytorch中,使用nn.Embedding词嵌入层来实现输入词的向量化

nn.Embedding(num_embeddings = 10, embedding_dim = 4)

nn.Embedding对象构建时,最主要有两个参数:

  • num_embeddings表示词的数量
  • embedding_dim表示用多少维的向量来表示每个词

将词转换为词向量的步骤:

  1. 先将语料进行分词,构建词与索引的映射,我们可以把这个映射叫做词表,词表中的每个词都对应了一个唯一的索引
  2. 然后使用nn,Embedding构建词嵌入矩阵,词索引对应的向量即为该词对应的数值化后的向量表示
import jieba
import torch
import torch.nn as nn# 分词
text = "北京冬奥的进度条已经过半,不少外国运动员在完成自己的比赛后踏上归途"
words = jieba.lcut(text)
print(words)print("-"*50)
# 去重
un_words = list(set(words))
print(un_words)
print("-"*50)
num = len(un_words)
print(num)# 调用embedding
embeds = nn.Embedding(num_embeddings=num, embedding_dim=3)
print(embeds(torch.tensor(4))) # 获取  '已经'  的词向量print("-"*50)for i,word in enumerate(un_words):print(word)print(embeds(torch.tensor(i)))
http://www.dtcms.com/wzjs/582833.html

相关文章:

  • 廊坊网站建设方案开发赣州网上问政
  • 网站推广具体内容简要说明做360手机网站优化排
  • 成都装饰公司网站建设做网站白云区
  • 高端网站定制建设公司哪家好网站策划书编写
  • 奉贤做网站价格设计公司注册需要什么条件
  • 上海网网站建电子商务项目策划书
  • 利川市网站建设东莞诚信通代运营
  • 新郑市网站建设做网站设计师的感想
  • 大连零基础网站建设教学培训天津网站制作专业
  • 东莞人才信息网网站怎么做排名优化
  • 减肥网站开发目的厦门电子商务网站建
  • 公司网站模板 网盘下载wordpress 模板破解
  • 大学网站html模板下载哈尔滨专业的制作网页
  • 针对茅台酒企业网站建设方案商标名字大全
  • 满足seo需求的网站网站类网站开发犯罪吗
  • 网站是做排行昆明seo网站建设
  • 威海建设集团信息网站浏览器代理怎么弄
  • 惠州网站建设熊掌号南京网站制作公司南京乐识专心
  • 网站建设系统怎么样wordpress出现的常见问题
  • 网络站点推广的方法网上销售方法
  • 自己做盗版影视网站上海博览会2022
  • 做异形建筑的网站如何推广网站会员注册
  • 什么是网站标题常见网站开发的语言
  • 简述网站建设的概念域名和网址的区别
  • 网站后台程序做网站是什么职业
  • 怎样手机网站建设aso如何优化
  • 网站系统参数设置商业推广软文范例
  • 上海专业做网站电话产品设计公司
  • 江西省住房和建设规划局局网站wordpress 获取侧边栏
  • 百度注册域名免费建站深圳网页设计推广服务