当前位置: 首页 > wzjs >正文

三明企业网站建设公司站外推广免费网站

三明企业网站建设公司,站外推广免费网站,python做个人网站,南通网站制作推广一、回顾: 对深度学习框架Python2.0进行自然语言处理有了一个基础性的认识注意力模型编码器(encoder_layer,用于分类的全连接层dense_layer),抛弃了传统的循环神经网络和卷积神经网络,通过注意力模型将任意位置的两个单词的距离转换成1编码器…

一、回顾:

  1. 对深度学习框架Python2.0进行自然语言处理有了一个基础性的认识
  2. 注意力模型编码器(encoder_layer,用于分类的全连接层dense_layer),抛弃了传统的循环神经网络和卷积神经网络,通过注意力模型将任意位置的两个单词的距离转换成1
  3. 编码器层和全连接层分开,利用训练好的模型作为编码器独立使用,并且根据具体项目接上不同的尾端,以便在运训练好的编码器上通过微调进行训

二、BERT简介: 

Bidirectional  Encoder Representation From transformer,替代了 word embedding 的新型文字编码方案,BERT 实际有多个encoder block叠加而成,通过使用注意力模型的多个层次来获得文本的特征提取

三、基本架构与应用

1.MLM:随机从输入语料中这闭掉一些单词,然后通过上下文预测该单词

2.NSP:判断句子B是否句子A的上下文

四、使用HUGGING FACE获取BERT与训练模型

1.安装

pip install transformers

2.引用 

import torch
from transformers import BertTokenizer
from transformers import BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
pretrain_model = BertModel.from_pretrained("bert-base-chinese")

3. 运用代码_获取对应文本的TOKEN

3.1('bert-base-chinese'模型)

import torch
from transformers import BertTokenizer
from transformers import BertModel
tokenizer = BertTokenizer.from_pretrained('bert-base-chinese')
pretrain_model = BertModel.from_pretrained("bert-base-chinese")tokens = tokenizer.encode("床前明月光",max_length=12,padding="max_length",truncation=True)
print(tokens)
print("----------------------")
print(tokenizer("床前明月光",max_length=12,padding="max_length",truncation=True))
print("----------------------")
tokens = torch.tensor([tokens]).int()
print(pretrain_model(tokens))

 3.2("uer/gpt2-chinese-ancient"模型)

import torch
from transformers import BertTokenizer,GPT2Model
model_name = "uer/gpt2-chinese-ancient"
tokenizer = BertTokenizer.from_pretrained(model_name)
pretrain_model = GPT2Model.from_pretrained(model_name)tokens = tokenizer.encode("春眠不觉晓",max_length=12,padding="max_length",truncation=True)
print(tokens)
print("----------------------")
print(tokenizer("春眠不觉晓",max_length=12,padding="max_length",truncation=True))
print("----------------------")tokens = torch.tensor([tokens]).int()
print(pretrain_model(tokens))

4.进行文本分类

数据准备>数据处理>模型设计>模型训练

get_data:

model:

 train:

 finally,随着训练,准确率会越来越高

http://www.dtcms.com/wzjs/524634.html

相关文章:

  • 网站消息推送今日新闻头条大事
  • 跨境电商平台怎么做seo推广效果
  • 做直播网站需要什么资质seo价格查询公司
  • 建立网站的软件下载收录入口在线提交
  • 广州中英文网站建设企业门户网站
  • 网站建设的一般步骤包括百度推广优化是什么意思
  • 设计公司网站建设模板图百度推广网址是多少
  • 网页设计代码全过程seo有什么作用
  • 做网站教程csdn黑帽seo培训
  • 阿里云网站建设教学视频教程seo哪家好
  • 企业网站架构企业网络营销策划案
  • 怎样把网站上传到空间电商网站建设公司
  • 沈阳成创网站建设公司友情链接代码模板
  • vb链接网站怎么做朋友圈营销
  • 销售公司怎么做网站竞价推广托管公司介绍
  • 平台类网站建设公司地推
  • 南京协会网站建设台州seo
  • 教育行业网站怎么做百度网盘搜索引擎入口
  • 网站编辑超链接怎么做网站keywords
  • 建设工程东莞网站建设技术支持seo免费优化软件
  • 做ppt的模板的网站有哪些内容中国网站排名网官网
  • wordpress资讯站苏州网站制作
  • 安徽省质量提升工程建设网站免费建站的网站
  • 怎么用上线了做网站网络优化
  • 企业品牌网站建设方案电子商务主要学什么就业方向
  • 网站建设不能在淘宝发布网络推广平台收费不便宜
  • 如何申请网站优化工作交换免费连接
  • ecs wordpress太慢无锡网络优化推广公司
  • wordpress日主题v3.2破解广州百度seo排名优化
  • 大学做视频网站设计附近学电脑培训班