当前位置: 首页 > wzjs >正文

哈尔滨做网站设计个人设计师为什么做网站

哈尔滨做网站设计,个人设计师为什么做网站,微信小程序开发注意事项,下列关于网站开发中网友上传参考视频:数字变矩阵 上一节课,我们已经把训练样本文字转成的数字,也就是Token化 那么在下一步之前,我们要把我们转成的数字,做一次嵌入向量的变换 上一节课,我们知道我们用的的词汇表整体的量是100256&…

参考视频:数字变矩阵


上一节课,我们已经把训练样本文字转成的数字,也就是Token化

 
那么在下一步之前,我们要把我们转成的数字,做一次嵌入向量的变换


上一节课,我们知道我们用的的词汇表整体的量是100256,那么每一个数字,分别代表了一个文字。0代表了感叹号,一是冒号,二是引号,然后我们的1000是“好”,还有其他的代表更多的,最后一个100255呢,代表是个英文单词叫Conveyor。

那么,我们实际上并不是把这些数字丢给模型去训练,而我们要找到一些代替这些数字的、一些更小的数字,为什么呢?因为在今后的训练当中,我们要做很多这种乘法,那么如果是数字很小、或者很大的时候,它们乘完之后,小的变得更小,大的变得更大,特别分散。所以我们要初始化一些非常小、非常集中的这些数字,来代表我们的这个token。

看到这个图之后,这个时候你就要问了,为什么你要有这么多列呢?第一列不就行了吗?找一个单独的数字代表一个单独的token,是不是就可以呢?实际上是可以的。

但是语言的魅力在于语境和语义有多种不同的关系。比如我们说意思的”思“字,比如这个1001就是意思的“思”字。那么在中文里,它有很多的不同语义,这个字,比如说“你是什么意思”、“这个没什么意思”、“那我不好意思”、“你意思意思”、“这什么意思?”... 有很多不同的语境,有的时候它是主语、有时候谓语、有的时候宾语、有的时候介词、有的时候动词、有的时候甚至是个形容词。

因为有不同的语义关系,所以我们每一个token要通过不同的多个子token、或者数字来代表它们在不同语义当中的这个意思。所以呢,我们定义了模型,定义了一个叫做d model这样的一个参数,它是一个超参数。在模型训练的时候,我们可以定义,要学习每一个文字在多少重不同的语境下的这种语义关系。那么在这里,我定义的是64。在ChatGPT当中定义的是512,现在越来越更大了,你可以定义成更多的维度,比如说1024。

那好,我们现在就用64个维度的d model来做我们的训练的超参数。也就是说我们现在有100255个不同的token,代表了不同的文字,那么每一个文字它有64个不同的语义关系。这样我们就有了一张非常巨大的表格,是一个100256个行和64列这样的一个表格,那么它也叫做一个矩阵。

这个表,是在训练之前,我们只建立一次就可以了。在每一次抽样训练的时候,是可以复用的表格,那这个也叫向量查找表embedding lookup table。使用方法是,当我们每一次抽取样本训练的时候,比如说我们抽取了10个文字,那么10个文字可能对应了十几个不同的token。比如说0的话,我们就把这一行抽出来,我们有十几个字,那就把这十几字对应的token的行都抽出来。

回到例子当中,那我们的input训练的样本数据是“小沈阳江西演唱会邀请了,”这几个字。那么它转换成token之后,一共是有16个token,这个就是我们所谓的context length=16。也就是说,我们在刚才的那个向量查找表里面,把31809的那一行给抽出来,然后把31106那行也给抽出来,一共我们抽了16行,那我们把这个16行给它拼成了一张表,那么它的维度呢,或者说它的列数呢,仍然是我们向量查找表里面的d model是64列,也就是说现在我们这个样本文字,已经转换成了一个16乘以64的一个矩阵,16行每一行都代表了一个token,64列每一列都代表了这个token在一个不同语义下的语境学习的数字。那么也叫做context_length by d_model这样的一个矩阵

其实我们在做什么呢?其实我们就是把样本文字数字化之后,把我们的token向量转换成了一个矩阵,那么这个就叫做embedding vector。之后,我们要把这个矩阵里面这些数字,丢给我模型去做计算,那么有的人会问,那你这些数字是哪来的?那我可以告诉大家,这些数字都是随机初始化的。在我们有了这个input embedding vector矩阵之后,我们就要把它丢到模型训练了。

那么在扔进模型之前,我们还要做一步,就是加入位置信息编码。请看下一节!!!
 


文章转载自:

http://OKLffNM6.rkxdp.cn
http://oD9SFSzY.rkxdp.cn
http://n2Tz7Hy6.rkxdp.cn
http://ZnmRH166.rkxdp.cn
http://DZIQJcVg.rkxdp.cn
http://fqcD7uqw.rkxdp.cn
http://azh24kQ6.rkxdp.cn
http://rena1MfS.rkxdp.cn
http://O69JqOF4.rkxdp.cn
http://YXcJBYKN.rkxdp.cn
http://Mdz7hyZc.rkxdp.cn
http://e3Yltth0.rkxdp.cn
http://hopOw32k.rkxdp.cn
http://nCDXFWWd.rkxdp.cn
http://FEyx8WTk.rkxdp.cn
http://9IyCdP0K.rkxdp.cn
http://l1NSA8sR.rkxdp.cn
http://fOx0KVYz.rkxdp.cn
http://MoIIAL7A.rkxdp.cn
http://tlRdSuzQ.rkxdp.cn
http://kaFEeUqU.rkxdp.cn
http://M1DcOZnc.rkxdp.cn
http://SGZccWKY.rkxdp.cn
http://bWJk2v7L.rkxdp.cn
http://N6U58dN0.rkxdp.cn
http://omLvb8lh.rkxdp.cn
http://ueSX1SF7.rkxdp.cn
http://dm7C1bPP.rkxdp.cn
http://4phtzvvW.rkxdp.cn
http://RAWdkr9S.rkxdp.cn
http://www.dtcms.com/wzjs/623548.html

相关文章:

  • 门户网站做wordpress KeyWords优化
  • 能发外链的网站宝山品牌网站建设
  • 邯郸专业做网站多少钱wordpress新用户下载权限
  • 阳谷企业做网站推广酒店营销策略
  • 做网站图片和文字字体侵权阿里巴巴做网站吗
  • 找建筑图纸的网站销售型企业网站
  • 局域网网站建设协议西安市建设工程信息网诚信信息平台诚信承诺书在哪儿下载
  • 如何自己做收费的视频网站做相册本哪个网站好用
  • 电商网站维护费用郑州做网站优化地址
  • 网络推广建立站点如何建立天津建设工程信息网滨海时报
  • 河南省和建设厅网站首页百度账号怎么改名字
  • thinkphp开发的网站康巴什网站建设
  • 昆山网站建设多少钱创意家居网站建设与管理
  • 上海建设工程质监局网站青岛市住房城乡建设厅网站
  • 南宁网站公司佛山网站如何制作
  • 个人网站怎么制作网站被墙 怎么做301
  • 电子商务公司网站模版搜索seo优化
  • 热门网站小红书营销推广方式
  • 做ppt设计师哪个网站好seo工作职责
  • 网站建设服务器广州网站建设 .超凡科技
  • 永久开源的免费建站系统京东的电子网站建设
  • 石家庄新钥匙网站建设做网站动图的软件
  • 如何在word里做网站简述电子政务网站设计的技术
  • 购物网站源码企业咨询管理公司简介
  • 中国摄影网站有哪些网站建设站
  • 物流网站建设工作岗位小程序制作流程收费
  • 网站制作优化排名android小程序开发
  • 江苏网站建设推广网站制作推广需要多少钱
  • html网站设计论文网站的构建一般要多久
  • 成都医疗网站建设搜索电影免费观看播放