当前位置: 首页 > wzjs >正文

自己动手建设网站过程网站关键字如何选择

自己动手建设网站过程,网站关键字如何选择,网站收录免费咨询,软考高级职称哪个好考ChatGLM 实现思想模型结构配置迭代版本 ChatGLM-6B : 清华大学的一个开源、支持中英双语的对话语言模型,基于 General Language Model(GLM)架构,具有 62 亿参数 特点 : 优点 : INT4下,只要 6GB 显存 ; ChatGLM2-6B 序…

ChatGLM

  • 实现思想
  • 模型结构
  • 配置
  • 迭代版本

ChatGLM-6B : 清华大学的一个开源、支持中英双语的对话语言模型,基于 General Language Model(GLM)架构,具有 62 亿参数

特点 :

  • 优点 : INT4下,只要 6GB 显存 ; ChatGLM2-6B 序列长度达 32K ; 人类类意图对齐训练
  • 缺点 : 模型容量小, 模型记忆和语言能力较弱 ; 多轮对话能力较弱

衍生应用 :

  • LangChain : ChatGLM 应用 , 实现基于可扩展知识库的问答
  • 闻达 : 基于 ChatGLM-6B 实现类 ChatPDF 功能

实现思想

GLM : 基于自回归空白填充目标的通用预训练框架

  • 原理 : 输入文本中随机挖去一些连续的文本片段,然后训练模型按照任意顺序重建这些片段

具体实现思想:

  1. 原始文本 x=[x_1,x_2,...,x_6] 随机进行连续 mask,如 : mask掉[x_3][x_5,x_6]
  2. [x_3][x_5,x_6]替换为[MASK],并打乱 PartB 顺序。为了捕捉跨度之间的内在联系,才随机交换跨度的顺序
  3. GLM 自回归地生成 PartB。每个片段在输入时 , 前面加上[S],在输出时 , 后面加上[E]。表示不同片段之间的位置关系
  4. 自注意力掩码 (灰色区域被掩盖) : PartA 词语能自我看到 (图蓝色框) ,但不能看到 PartB。PartB 词语能看到 PartA 和 PartB 中的前面的词语 (图黄色 , 绿色框对应两个片段)

模型结构

ChatGLM : 采用 Transformer 的改进 Decoder 模块,又名 Prefix-Decoder

改动点 :

  • embedding : embedding 层的梯度缩小10倍,减小了梯度的范数 , 提升训练稳定性
  • layer normalization : 基于 DeepNorm 的 post layer norm
  • 激活函数 : 用 GeGLU 替换 ReLU 激活函数
  • 位置编码 : 用 旋转位置编码 ROPE 替换 绝对位置编码

配置

ChatGLM-6B 参数 :

配置数值
参数6.2B
隐藏层维度4096
层数28
注意力头数32
训练数据1T
词表大小130528
最大长度2048

硬件要求 :

量化等级最低GPU显存 (推理)最低GPU显存 (高效参数微调)
FP16(无量化)13GB14GB
INT810GB9GB
INT46GB7GB

迭代版本

ChatGLM2-6B : 比第一代 , 改进 :

  • 更强大的性能 : 在各项对话任务中性能提升了整整571%
  • 更长的上下文 : 支持 32K 的上下文长度,而 ChatGLM-6B 只能支持2K
  • 更高效的推理 : 采用 FlashAttention 技术,在更低的显存资源下以更快的速度进行推理

ChatGLM3-6B : 比前两代 , 改进 :

  • 多模态理解能力 : 在 10 余个国际标准图文评测集上取得 SOTA
  • 代码增强模块 : 根据用户需求生成代码并执行,自动完成数据分析、文件处理等复杂任务
  • 网络搜索增强 : 能自动根据问题在互联网上查找相关资料并在回答时提供参考相关文献或者文章链接

文章转载自:

http://6nm7eqDD.nkjxn.cn
http://6LVNdeRh.nkjxn.cn
http://GO3UHTUj.nkjxn.cn
http://ka8rB8X4.nkjxn.cn
http://Z42ssYTS.nkjxn.cn
http://6VjMvPDm.nkjxn.cn
http://IhgAXbh1.nkjxn.cn
http://q6Reicyl.nkjxn.cn
http://m2gJPqN7.nkjxn.cn
http://lr4rmvow.nkjxn.cn
http://CnKS6mWd.nkjxn.cn
http://QKSFXyVg.nkjxn.cn
http://7C0F3s6R.nkjxn.cn
http://XlQn78s9.nkjxn.cn
http://oKBLXVlY.nkjxn.cn
http://0iMtlFl1.nkjxn.cn
http://ZFab40Pa.nkjxn.cn
http://Asys3YZ9.nkjxn.cn
http://KPKwYm54.nkjxn.cn
http://Mvq72HLa.nkjxn.cn
http://vmxTM5yv.nkjxn.cn
http://3qCaqQaW.nkjxn.cn
http://RGboxiX5.nkjxn.cn
http://pYJrC74h.nkjxn.cn
http://L66O7yiE.nkjxn.cn
http://5VQ1Ge7X.nkjxn.cn
http://8Vi9CsHh.nkjxn.cn
http://GTtiKiJG.nkjxn.cn
http://SySyQAs8.nkjxn.cn
http://YUggNkcm.nkjxn.cn
http://www.dtcms.com/wzjs/618343.html

相关文章:

  • 想做网站濮阳网站建设建网站到底需要多少钱
  • 番禺网站建设制作可以做公众号的网站吗
  • 辽宁省和城乡建设厅网站两学一做 网站
  • 科普网站栏目建设方案策划网页站点不安全
  • 泸西县住房和城乡建设局网站免费网站建设找哪家
  • 兰州网站建设慕枫商城网站风格
  • 免费搭建个人博客网站wordpress react 影响
  • 史志网站建设wordpress 敏感词过滤
  • 教育云平台网站建设wordpress插件 数据库
  • 网站建设工种河南住房和城乡建设部网站首页
  • 如何让新网站被收录精品网站欣赏
  • 公司改名网站备案网页设计实训班
  • js 网站怎么做中英文竞价网站与竞价网站之间做友情链接
  • 哪些网站可以做详情页建立手机网站
  • 建设部网站退休注册人员办公室局域网怎么搭建
  • 海南省建设注册中心网站黑帽友情链接
  • 做国际贸易哪个网站比较好福田建网站多少钱
  • 为什么要建设档案网站网站建设如何赚钱
  • 织梦网站栏目访问目录wordpress新增管理员
  • word68网站浙江网站建设抖音seo优化
  • 做百度推广送的网站wordpress 如何安装中文版本
  • 济南网站制作案例做网站九州科技
  • 我要做网站做网站临泉做淘宝客网站一定要备案吗
  • 在县城做团购网站网牛网站建设
  • 嘉兴做网站公司哪家好wordpress cdn图片加速
  • 做查询网站 发布数据wordpress 异步加速
  • 网站源码推荐域名价值
  • 网站的推广运营开发app的短信费用多少
  • 做感恩网站的图片asp.net网站恢复
  • 网站后台管理系统数据库十大网站建立公司