当前位置: 首页 > wzjs >正文

网站一键生成微商加人的24种方法

网站一键生成,微商加人的24种方法,南阳seo网站价格,江阴建设银行网站本文基于百度昆仑第二代硬件 前提 当前百度硬件tensor core支持的输入:int16, int8, bfp16 当前百度硬件tensor core支持的计算方式: int16, fp16,int8 常见的LLM大模型激活类型:fp16,bfp16 c…

本文基于百度昆仑第二代硬件

前提

当前百度硬件tensor core支持的输入:int16, int8, bfp16
当前百度硬件tensor core支持的计算方式: int16, fp16,int8
常见的LLM大模型激活类型:fp16,bfp16
cache类型:fp16, bfp16,int8,int4

量化

这里列举一下当前常用的方式以及量化方法

激活cache计算方式
类型1fp16fp16量化到int16,然后做int16*int16的计算,输出反量化到fp16
类型2fp16int8输入量化到int16(实为int8 * 2),与cache 做两次计算,最后输出反量化到fp16

这里主要讨论一下cache 的量化方式:

  1. 当用类型1时,cache为fp16,此时需要量化到int16,此时需要一个per cache的 max/scale值来进行量化。(计算量 cache len)
    这里可以做一个优化,保存一个per cache 的max值,每次插入数据时更新per cache max值。(计算量 1)
    然而,当遇到动态插入情况时,如下图图2,Q4结束了,Q6插入,但这时Q4的max值还在cache max值中,这里有一个解决版本,保存per batch 的max,当某个batch 结束了,置空该值,然后在送入attention算子之前提前更新per cache max值 (计算量 batch)
    在这里插入图片描述

  2. 当用类型2时,输入时int8,主要涉及到的是反量化,用到了静态量化方式。
    常见的静态量化为:per channel,百度采用per head量化,(seqlen, head_num, head_dim)在head_num维度做量化。

题外

当然这些量化方式对硬件来说不需要关注,硬件只需要知道这一批数据max值是多少,量化还是反量化,输入输出类型是啥。怎么用就属于算子层实现,
例如:per head量化方式

for (int i = 0; i < seqlen; i++) {for (int j = 0; j < head_num; j++) {float scale = head_num_sacle[j];for (int k = 0; k < head_dim; k++) {dequant_or_quant(x, y, scale);}}
}
http://www.dtcms.com/wzjs/810708.html

相关文章:

  • 新开传奇网站手游万网一台虚拟主机做多个网站
  • 单页营销式网站模板下载把做的网站放到互联网上
  • 深圳网站设计制作元软件系统设计
  • win10做网站鞍山微信小程序开发公司
  • 网站开发经验总结wordpress主题选择
  • 爱做网站视频四川建设厅网站查询
  • python3 网站开发怎么做购物网站的分类目录
  • 最牛的大型网站建设公司网页生成pdf失败
  • 长春网站建设硕成传媒免费咨询律师在线一对一问答
  • 网站肯定被k东莞网络营销策划有限公司
  • 旅行社网站规划与建设wordpress插件拖拽
  • 昆明 五华 网站建设网站建设之后需要维护吗
  • 陕西交通建设有限公司网站专注网站建设与优化
  • 商城网站建设第一章大连网站建设 青鸟传媒
  • 网站建设 绍兴的公司个人做外贸商城网站
  • 网站开发设计方案哪个网站可以找人做清洁
  • 公司网站建设费用会计入账购物网站哪个东西便宜质量好
  • 网站维护合同范本怎样在文章后做网站链接
  • 广西住房和城乡建设官方网站百川互联
  • 广告网站建设公司福州建设部官方网站
  • 网站开发主要内容和要求网站建设与维护是做什么
  • 网站透明导航代码赣州网络公司排名
  • 备案 网站名称 怎么改做网站到底能不能赚钱
  • 企业网站 多网站推广wordpress 恢复默认
  • 易企秀网站开发语言自己买台服务器做网站
  • 简单 网站学网站开发怎么就业
  • 平安网站建设公司阿里云网站建设的功能
  • 开发网站商城wordpress主题转typecho
  • 电子商务网站建设的安全性遵义网站开发公司
  • 织梦网站修改使用网页微信二维码怎么扫