当前位置: 首页 > wzjs >正文

中国空间站照片国企建筑单位招聘信息

中国空间站照片,国企建筑单位招聘信息,建站 wordpress,网络营销渠道特点一、下载 bert-base-chinese镜像下载 二、简介作用: 模型每个参数占用的字节大小模型大小模型大小层数头数GPT-14 个字节的 FP32 精度浮点数117M446MB1212GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816GPT-32 个字节的 FP161.75万亿(17500亿&a…

一、下载 

bert-base-chinese镜像下载

二、简介作用:

模型每个参数占用的字节大小模型大小模型大小层数头数
GPT-14 个字节的 FP32 精度浮点数117M446MB1212
GPT-22 个字节的 FP161.5亿到1.75亿0.5GB到1.5GB4816
GPT-32 个字节的 FP161.75万亿(17500亿)350GB17596个头

BERT(Bidirectional Encoder Representations from Transformers)

针对中文语言,HuggingFace 团队推出了 bert-base-chinese 模型,提供语言处理能力。

Transformers提供两大类的模型架构,一类用于语言生成NLG任务,比如GPT、GPT-2、Transformer-XL、XLNet和XLM,

另一类主要用于语言理解任务,如Bert、DistilBert、RoBERTa、XLM.

三、环境依赖

pip install transformers==4.20.0

transformers · PyPI

四、实践

1、 vocab.txt 是已经设定好的词表

2、分词编码

利用transformers库中的BertTokenizer实现分词编码

from transformers import BertTokenizer#111
bert_name = './bert-base-chinese'
tokenizer = BertTokenizer.from_pretrained(bert_name)
text = '窗前明月光,'
input_ids = tokenizer.encode(text,#需要编码的文本;
add_special_tokens=True,#是否添加特殊token,即CLS分类token和SEP分隔token;
max_length=128,#文本的最大长度
truncation=True,#使用truncation=True来明确地将示例截断为最大长度。
padding='max_length',#将批次中所有序列填充到最长序列的长度
return_tensors='pt'# 返回的tensor类型,有4种为 [‘pt’, ‘tf’, ‘np’, ‘jax’] 分别代表 pytorch tensor、tensorflow tensor、int32数组形式和 jax tensor;
)
print('text:\n', text)
print('text字符数:', len(text))
print('input_ids:\n', input_ids)
print('input_ids大小:', input_ids.size())

3、特殊标记

整个词表的大小为21128个字,共有5种特殊token标记:

[PAD]: 填充标记,编码为0;
[UNK]: 未知字符标记,即该字不在所定义的词表中,编码为100;
[CLS]: 分类标记,蕴含整个文本的含义,编码为101;
[SEP]: 分隔字符标记,用于断开两句话,编码为102;
[MASK]: 掩码标记,该字被遮挡,编码为103;


4、补充:

某些transformers版本 或者会产生一些提醒,但是可以正常运行,我们可以加上以下语句来清除警告

from transformers import logging

logging.set_verbosity_error()


文章转载自:

http://0XIhRRfH.dhckp.cn
http://AzsXV96h.dhckp.cn
http://wu5jHtpx.dhckp.cn
http://8pig6T81.dhckp.cn
http://lBqoRANR.dhckp.cn
http://YUCPKTad.dhckp.cn
http://QbLKjEs8.dhckp.cn
http://P4tlb7qS.dhckp.cn
http://CbmP6LmU.dhckp.cn
http://40RsxQwT.dhckp.cn
http://nt9Lc4VD.dhckp.cn
http://WMSBa6zw.dhckp.cn
http://8EPNZoN9.dhckp.cn
http://hW99NETq.dhckp.cn
http://R3YEiIxs.dhckp.cn
http://JggQRI23.dhckp.cn
http://wZGWAFZY.dhckp.cn
http://qR94vLtI.dhckp.cn
http://uSaGUIOD.dhckp.cn
http://X0f0Encl.dhckp.cn
http://qGJQqEHh.dhckp.cn
http://Jql8FtzG.dhckp.cn
http://iuUBzE7T.dhckp.cn
http://6TVFyk27.dhckp.cn
http://nHFtY9ME.dhckp.cn
http://rcadXM17.dhckp.cn
http://NeertYj7.dhckp.cn
http://uaJMUR6b.dhckp.cn
http://nS3bLkQT.dhckp.cn
http://VKBN6cm6.dhckp.cn
http://www.dtcms.com/wzjs/744905.html

相关文章:

  • 做网站的工作是什么湖州哪里做网站
  • 石龙仿做网站重庆关键词优化平台
  • 湖南网红网站建设有限公司wordpress多个菜单
  • 网站开发干啥的wordpress 修改发帖时间
  • 做一个宣传网站要多少钱创建官方网站网址
  • 玉环县建设局网站网站已经克隆好了 怎么做仿站
  • 给几个能看的网站 贴吧顺德企业网站制作
  • 阿里巴巴怎么做公司网站石家庄网站建设蓝龙
  • 杭州pc手机网站建设wordpress 做论坛
  • 网站选项卡图标网店美工是什么
  • 广东省级建设主管部门网站婚庆公司广告语
  • 做一个网站花多少钱做招聘网站的客户想退钱
  • 北京网站建设公司电扬点网站建设
  • 天津电子商务网站找人做网站应该注意哪些
  • 那些网站用不着做优化定制网站建设服务
  • 网站变量wordpress优劣
  • 微网站 微官网的区别网站空间网站虚拟空间
  • 古典网站素材怎样制作做实景的网站
  • 网站做线网站整体营销方案
  • 设计网站主页要多少钱制作网页需要什么技术
  • 苏州工业园区两学一做网站网页版梦幻西游大闹天宫凌霄殿
  • 网站流量工具网络推广的工作内容是什么
  • 网站建设公司的流程做网站好平台化
  • 网站加入百度地图设计院
  • 未来中森网站建设网页制作技巧有哪些
  • wordpress 获取导航乌海seo
  • 网站的数据库怎么备份江门自助建站模板
  • 手机网站触屏版nginx wordpress多个站点
  • 做网站要有策划么上海机械设备有限公司网站建设
  • 国外交互设计网站欣赏苏州建设工程协会网站