当前位置: 首页 > wzjs >正文

基础微网站开发信息wap网络

基础微网站开发信息,wap网络,外贸企业网站推广方案,wordpress主题 team talk一、下载 bert-base-chinese镜像下载 二、简介作用: 模型每个参数占用的字节大小模型大小模型大小层数头数GPT-14 个字节的 FP32 精度浮点数117M446MB1212GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816GPT-32 个字节的 FP161.75万亿(17500亿&a…

一、下载 

bert-base-chinese镜像下载

二、简介作用:

模型每个参数占用的字节大小模型大小模型大小层数头数
GPT-14 个字节的 FP32 精度浮点数117M446MB1212
GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816
GPT-32 个字节的 FP161.75万亿(17500亿)350GB17596个头

BERT(Bidirectional Encoder Representations from Transformers)

针对中文语言,HuggingFace 团队推出了 bert-base-chinese 模型,提供语言处理能力。

Transformers提供两大类的模型架构,一类用于语言生成NLG任务,比如GPT、GPT-2、Transformer-XL、XLNet和XLM,

另一类主要用于语言理解任务,如Bert、DistilBert、RoBERTa、XLM.

三、环境依赖

pip install transformers==4.20.0

transformers · PyPI

四、实践

1、 vocab.txt 是已经设定好的词表

2、分词编码

利用transformers库中的BertTokenizer实现分词编码

from transformers import BertTokenizer#111
bert_name = './bert-base-chinese'
tokenizer = BertTokenizer.from_pretrained(bert_name)
text = '窗前明月光,'
input_ids = tokenizer.encode(text,#需要编码的文本;
add_special_tokens=True,#是否添加特殊token,即CLS分类token和SEP分隔token;
max_length=128,#文本的最大长度
truncation=True,#使用truncation=True来明确地将示例截断为最大长度。
padding='max_length',#将批次中所有序列填充到最长序列的长度
return_tensors='pt'# 返回的tensor类型,有4种为 [‘pt’, ‘tf’, ‘np’, ‘jax’] 分别代表 pytorch tensor、tensorflow tensor、int32数组形式和 jax tensor;
)
print('text:\n', text)
print('text字符数:', len(text))
print('input_ids:\n', input_ids)
print('input_ids大小:', input_ids.size())

3、特殊标记

整个词表的大小为21128个字,共有5种特殊token标记:

[PAD]: 填充标记,编码为0;
[UNK]: 未知字符标记,即该字不在所定义的词表中,编码为100;
[CLS]: 分类标记,蕴含整个文本的含义,编码为101;
[SEP]: 分隔字符标记,用于断开两句话,编码为102;
[MASK]: 掩码标记,该字被遮挡,编码为103;


4、补充:

某些transformers版本 或者会产生一些提醒,但是可以正常运行,我们可以加上以下语句来清除警告

from transformers import logging

logging.set_verbosity_error()

http://www.dtcms.com/wzjs/533847.html

相关文章:

  • 阿里云建设网站流程网站备案费一般是多少
  • 中山手机网站制作多少钱西宁做网站君博示范
  • 泰安集团网站建设报价公司购买网站建设费用会计分录
  • 网站静态化的处理东营最新消息今天
  • 建设银行对公网站打不开做网站注册页面模板
  • 淘宝上做网站权重农村建设商城网站的好处
  • 新县城乡规划建设局网站关于色彩搭配的网站
  • collectfrom企业网站模版外贸跨境电商平台有哪些
  • 写作网站打不开网页无法访问6
  • 网站快照怎么更新河北建设厅注册中心网站首页
  • html5 触屏网站 案例查询类网站用什么做
  • 手机怎样建立网站邢台市信都区
  • 京东商城网站怎么做珠海微网站建设
  • 上海做机床的公司网站房地产网站建设哪家好
  • 常见网站开发的语言做logo什么网站
  • 云免网站空间网站建设中遇到的问题
  • 山西网站设计2018年深圳建设网站公司
  • 网站空间那个好成都微商城开发公司
  • asp.net网站安装教程四川省城乡住房建设部网站首页
  • 做购物网站开发价格大连微网站开发
  • 常德网站建设开发哪家好网站集约化建设工作总结
  • 一键免费生成网页的网站怎么改网站模块
  • 网站开发信息文档建站系统源码
  • 广州seo网站优化培训延吉网站建设公司
  • 织梦网站被攻击html5博客网站模板
  • 小网站开发设计师对网站的意义
  • 17网站一起做网站怎样做外链
  • 高青网站建设yx718新乡网站优化公司
  • 网站ftp查询公众号开发教程视频
  • 南山做网站网站建设郑州公司