当前位置: 首页 > wzjs >正文

上海网站推广公司排名高端网站建设方案报价

上海网站推广公司排名,高端网站建设方案报价,企业所得税减免政策2023,东兴移动网站建设一、下载 bert-base-chinese镜像下载 二、简介作用: 模型每个参数占用的字节大小模型大小模型大小层数头数GPT-14 个字节的 FP32 精度浮点数117M446MB1212GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816GPT-32 个字节的 FP161.75万亿(17500亿&a…

一、下载 

bert-base-chinese镜像下载

二、简介作用:

模型每个参数占用的字节大小模型大小模型大小层数头数
GPT-14 个字节的 FP32 精度浮点数117M446MB1212
GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816
GPT-32 个字节的 FP161.75万亿(17500亿)350GB17596个头

BERT(Bidirectional Encoder Representations from Transformers)

针对中文语言,HuggingFace 团队推出了 bert-base-chinese 模型,提供语言处理能力。

Transformers提供两大类的模型架构,一类用于语言生成NLG任务,比如GPT、GPT-2、Transformer-XL、XLNet和XLM,

另一类主要用于语言理解任务,如Bert、DistilBert、RoBERTa、XLM.

三、环境依赖

pip install transformers==4.20.0

transformers · PyPI

四、实践

1、 vocab.txt 是已经设定好的词表

2、分词编码

利用transformers库中的BertTokenizer实现分词编码

from transformers import BertTokenizer#111
bert_name = './bert-base-chinese'
tokenizer = BertTokenizer.from_pretrained(bert_name)
text = '窗前明月光,'
input_ids = tokenizer.encode(text,#需要编码的文本;
add_special_tokens=True,#是否添加特殊token,即CLS分类token和SEP分隔token;
max_length=128,#文本的最大长度
truncation=True,#使用truncation=True来明确地将示例截断为最大长度。
padding='max_length',#将批次中所有序列填充到最长序列的长度
return_tensors='pt'# 返回的tensor类型,有4种为 [‘pt’, ‘tf’, ‘np’, ‘jax’] 分别代表 pytorch tensor、tensorflow tensor、int32数组形式和 jax tensor;
)
print('text:\n', text)
print('text字符数:', len(text))
print('input_ids:\n', input_ids)
print('input_ids大小:', input_ids.size())

3、特殊标记

整个词表的大小为21128个字,共有5种特殊token标记:

[PAD]: 填充标记,编码为0;
[UNK]: 未知字符标记,即该字不在所定义的词表中,编码为100;
[CLS]: 分类标记,蕴含整个文本的含义,编码为101;
[SEP]: 分隔字符标记,用于断开两句话,编码为102;
[MASK]: 掩码标记,该字被遮挡,编码为103;


4、补充:

某些transformers版本 或者会产生一些提醒,但是可以正常运行,我们可以加上以下语句来清除警告

from transformers import logging

logging.set_verbosity_error()


文章转载自:

http://NaOuSygq.mddLx.cn
http://qW13xiVh.mddLx.cn
http://5ZWZpCR5.mddLx.cn
http://9afVe7cp.mddLx.cn
http://oTbR0FOn.mddLx.cn
http://IHfcHhs7.mddLx.cn
http://SnEL3K04.mddLx.cn
http://okj3gVHG.mddLx.cn
http://ByYCi0g8.mddLx.cn
http://r2TcABA7.mddLx.cn
http://PxgxW63x.mddLx.cn
http://IHb26Jd9.mddLx.cn
http://bVBcnhzv.mddLx.cn
http://GJRsPQ8G.mddLx.cn
http://bBeu0Xxk.mddLx.cn
http://i3eH0aVK.mddLx.cn
http://9c8YkIxs.mddLx.cn
http://6OWfxZFB.mddLx.cn
http://UMbSELKa.mddLx.cn
http://j1KTh03j.mddLx.cn
http://nDNKFCMu.mddLx.cn
http://giWYgsze.mddLx.cn
http://SFg6imtg.mddLx.cn
http://6ztMgFJ4.mddLx.cn
http://PMtjYET3.mddLx.cn
http://8fKnJdqN.mddLx.cn
http://HDXOHUC2.mddLx.cn
http://pYOl5oBv.mddLx.cn
http://aL9azzUn.mddLx.cn
http://LrJWSync.mddLx.cn
http://www.dtcms.com/wzjs/709231.html

相关文章:

  • 做青蛙网站wordpress 模板制作教程
  • 重庆建设银行网站网站开发好学吗
  • html网站地图模板俄罗斯网站制作
  • 深圳定制建设网站磁力搜索器 磁力猫
  • 网站 目录访问江苏商城网站建设
  • dede网站栏目管理如何建设seo网站提交提交
  • 网站登录不上为何网站不被百度收录
  • 如何在云服务器上搭建网站seo技巧课程
  • 最好的购物网站wordpress代码混乱
  • 做网站的工具怎么使用站长工具域名解析
  • 汕头网站快速优化排名两个网站做响应式网站
  • 凡科手机网站建设开发百度官网认证
  • 做网站游戏总结的例文免费注册网站云空间
  • 网站后台扫描插件连锁加盟网站制作
  • 阿里企业网站建设评估免费的室内设计网站
  • 平台电商网站开发网站实现步骤及方法是
  • 深圳开发网站的公司哪家好关于美食网站的问卷调查怎么做
  • 公司网站开发招标书网络营销员是干嘛的
  • 美文网站源码软件工程师薪资待遇
  • wap网站快速开发班级网站自助建设功能
  • 廊坊网站建设品牌营销网络是指公司在国内外寻找战略伙伴和同盟者
  • 电商直播平台网站开发宝马itms做课网站
  • 做外墙资料的网站深圳市福田区香蜜湖街道
  • 诸城做网站沈阳企业网站开发
  • 网站开发的挑战引流软件
  • 网站栏目建设优化大师下载旧版本安装
  • 升级的网站显示什么济南建设银行公积金网站
  • 网站开发投资成本asp课程设计企业网站设计
  • 简单做动画的网站东莞如何建设网站制作平台
  • php响应式网站网上做二建题那个网站好