当前位置: 首页 > wzjs >正文

北京怀柔做网站管理运营的公司吉林网站建设吉林

北京怀柔做网站管理运营的公司,吉林网站建设吉林,网站如何做淘宝支付,在网站做电子画册一、下载 bert-base-chinese镜像下载 二、简介作用: 模型每个参数占用的字节大小模型大小模型大小层数头数GPT-14 个字节的 FP32 精度浮点数117M446MB1212GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816GPT-32 个字节的 FP161.75万亿(17500亿&a…

一、下载 

bert-base-chinese镜像下载

二、简介作用:

模型每个参数占用的字节大小模型大小模型大小层数头数
GPT-14 个字节的 FP32 精度浮点数117M446MB1212
GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816
GPT-32 个字节的 FP161.75万亿(17500亿)350GB17596个头

BERT(Bidirectional Encoder Representations from Transformers)

针对中文语言,HuggingFace 团队推出了 bert-base-chinese 模型,提供语言处理能力。

Transformers提供两大类的模型架构,一类用于语言生成NLG任务,比如GPT、GPT-2、Transformer-XL、XLNet和XLM,

另一类主要用于语言理解任务,如Bert、DistilBert、RoBERTa、XLM.

三、环境依赖

pip install transformers==4.20.0

transformers · PyPI

四、实践

1、 vocab.txt 是已经设定好的词表

2、分词编码

利用transformers库中的BertTokenizer实现分词编码

from transformers import BertTokenizer#111
bert_name = './bert-base-chinese'
tokenizer = BertTokenizer.from_pretrained(bert_name)
text = '窗前明月光,'
input_ids = tokenizer.encode(text,#需要编码的文本;
add_special_tokens=True,#是否添加特殊token,即CLS分类token和SEP分隔token;
max_length=128,#文本的最大长度
truncation=True,#使用truncation=True来明确地将示例截断为最大长度。
padding='max_length',#将批次中所有序列填充到最长序列的长度
return_tensors='pt'# 返回的tensor类型,有4种为 [‘pt’, ‘tf’, ‘np’, ‘jax’] 分别代表 pytorch tensor、tensorflow tensor、int32数组形式和 jax tensor;
)
print('text:\n', text)
print('text字符数:', len(text))
print('input_ids:\n', input_ids)
print('input_ids大小:', input_ids.size())

3、特殊标记

整个词表的大小为21128个字,共有5种特殊token标记:

[PAD]: 填充标记,编码为0;
[UNK]: 未知字符标记,即该字不在所定义的词表中,编码为100;
[CLS]: 分类标记,蕴含整个文本的含义,编码为101;
[SEP]: 分隔字符标记,用于断开两句话,编码为102;
[MASK]: 掩码标记,该字被遮挡,编码为103;


4、补充:

某些transformers版本 或者会产生一些提醒,但是可以正常运行,我们可以加上以下语句来清除警告

from transformers import logging

logging.set_verbosity_error()


文章转载自:

http://gQyHvfJD.Lnrht.cn
http://rxSDo643.Lnrht.cn
http://tqJNss28.Lnrht.cn
http://S8AYyQRj.Lnrht.cn
http://ZxfDdcQ9.Lnrht.cn
http://fTiHerqc.Lnrht.cn
http://VQm3TZl0.Lnrht.cn
http://rfRwu0Br.Lnrht.cn
http://b3A4QUEF.Lnrht.cn
http://KXGSyFKf.Lnrht.cn
http://0pDh5eOX.Lnrht.cn
http://BLuNV29V.Lnrht.cn
http://cInhHdhp.Lnrht.cn
http://Z0Pj6B57.Lnrht.cn
http://1CjS46xi.Lnrht.cn
http://a75rhuEa.Lnrht.cn
http://4Ow8hwwd.Lnrht.cn
http://YL916IFG.Lnrht.cn
http://OwrvjUEo.Lnrht.cn
http://riAdG8Uw.Lnrht.cn
http://xXnLnMtE.Lnrht.cn
http://pLigXabQ.Lnrht.cn
http://D9DbiSQf.Lnrht.cn
http://YNsf82QW.Lnrht.cn
http://XBaeLzOX.Lnrht.cn
http://msfH6cqK.Lnrht.cn
http://M4YQaxrj.Lnrht.cn
http://YHF1Ume5.Lnrht.cn
http://HuOJRsKy.Lnrht.cn
http://XOwbcDnk.Lnrht.cn
http://www.dtcms.com/wzjs/771074.html

相关文章:

  • 低价网站建设浩森宇特重庆分类健康管理
  • 海口省建设厅网站北京高端网站建设制作设计
  • 网站收录批量查询网站建设前的功能
  • 做网盟的网站必须备案天元建设集团有限公司重要事件
  • 电子商务网站建设作业文档网站后台管理系统模板 html
  • 360企业自助建站免费网站推广网站在线
  • 零陵旅游建设投资公司网站制作自己盈利的网站
  • 门户网站建设 请示微信公众号运营推广方案
  • one dirve做网站织梦动漫网站模版
  • 天津市城市建设档案馆网站昆山汽车网站建设
  • 山西省建设厅勘察设计协会网站万盛网站建设公司
  • 一个人做电商网站难吗企业为什么需要会计
  • 贵阳网站制作工具天津做网站推广的网站
  • app开发公司网站韩国网站空间推荐
  • 官网整站优化免费单页在线制作
  • 网站制作学什么软件进入公众号免费获取验证码
  • 好网站有没有商标logo创意免费一键生成
  • 人才市场网站建设论文网站建设公司好哪家好
  • 成都网站建设上市维护网站信息
  • 做网站的公司msggwordpress评论颜文字
  • 沈阳网页建站模板电子书下载网站建设
  • 做试客刷单的网站有哪些小程序开发的服务怎么样
  • 南昌网站建设 南昌做网站公司惠安网站建设公司
  • 公司建设网站制作网站标题关键词用什么隔开
  • 中文电商网站模板网站备案准备资料
  • wordpress怎样做手机站网网站建设的公司
  • 网站建设好找工作烟台市政建设招标网站
  • 洛阳专注网站建设的公司网站开发网站设计
  • 三把火科技网站设计四川建设行业数据共享平台
  • 计算机网站建设 是什么电信网站备案系统