当前位置: 首页 > news >正文

搜索网站定制公司哪个网站注册域名好

搜索网站定制公司,哪个网站注册域名好,网站建设卖花网站的目的,钓鱼网站开发系列教程1️⃣ 基本概念 量化的目标 量化(Quantization)是将浮点数权重或激活映射到整数表示,从而降低模型存储和计算成本。 量化公式通常为: qround(rs) q \text{round}\left(\frac{r}{s}\right) qround(sr​) 其中: rrr 是浮…

1️⃣ 基本概念

量化的目标

量化(Quantization)是将浮点数权重或激活映射到整数表示,从而降低模型存储和计算成本。

量化公式通常为:

q=round(rs) q = \text{round}\left(\frac{r}{s}\right) q=round(sr)

其中:

  • rrr 是浮点数权重或激活
  • qqq 是整数表示
  • sss 是 scale(缩放因子)
  • 对于 非对称量化,还有 zero-point zzz

q=round(rs)+z q = \text{round}\left(\frac{r}{s}\right) + z q=round(sr)+z


Per-Tensor 量化

  • 定义:整个张量使用一个统一的 scale(和 zero-point)进行量化。
  • 公式(对称量化为例):

s=max⁡(∣W∣)2b−1−1 s = \frac{\max(|W|)}{2^{b-1}-1} s=2b11max(W)

其中:

  • WWW 是权重张量
  • bbb 是量化位宽(比如 8-bit)

特点

  • 只用一个 scale,简单高效
  • 所有通道 使用相同 scale
  • 对权重差异较大的通道,会出现精度损失

Per-Channel 量化

  • 定义:对张量的每个输出通道(通常是卷积的 out_channels 或 Linear 的 out_features)使用独立的 scale(和 zero-point)进行量化。
  • 公式(对称量化):对每个通道 ccc

sc=max⁡(∣Wc∣)2b−1−1 s_c = \frac{\max(|W_c|)}{2^{b-1}-1} sc=2b11max(Wc)

特点

  • 每个通道的 scale 不同,更精细,能够保留不同通道权重的动态范围
  • 更高精度,尤其是卷积网络里通道差异大时
  • 实现稍复杂,需要在推理时对每个通道单独反量化

2️⃣ 举例对比

假设有一个 4×3 的卷积权重:

W=[0.10.2−0.13.0−2.51.20.050.1−0.05−1.00.50.2] W = \begin{bmatrix} 0.1 & 0.2 & -0.1 \\ 3.0 & -2.5 & 1.2 \\ 0.05 & 0.1 & -0.05 \\ -1.0 & 0.5 & 0.2 \end{bmatrix} W=0.13.00.051.00.22.50.10.50.11.20.050.2

  • Per-Tensor 量化

    • 找整个张量最大绝对值:3.0
    • scale = 3.0 / 127 ≈ 0.0236
    • 所有元素都用这个 scale 量化 → 小数值会损失较多精度
  • Per-Channel 量化(按行/通道量化):

    • 通道 1 max=3.0 → s1=0.0236
    • 通道 2 max=2.5 → s2≈0.0197
    • 通道 3 max=1.2 → s3≈0.00945
    • 每个通道单独量化 → 精度更高

3️⃣ 优缺点对比

特性Per-TensorPer-Channel
精度较低(通道动态范围不同损失大)较高
实现复杂度简单复杂(每通道独立 scale)
存储开销少(一个 scale)多(每个通道一个 scale)
常用场景激活量化(A8)、小模型权重量化(W8)、大模型

4️⃣ PyTorch 示例

import torch
import torch.nn as nn
import torch.quantization as tq# 假设线性层权重
weight = torch.tensor([[0.1, 0.2, -0.1],[3.0, -2.5, 1.2],[0.05, 0.1, -0.05],[-1.0, 0.5, 0.2]])# Per-Tensor 量化
scale = torch.max(weight.abs()) / 127
q_weight_tensor = torch.round(weight / scale)
print("Per-Tensor Quantized:\n", q_weight_tensor)# Per-Channel 量化 (按行)
scales = torch.max(weight.abs(), dim=1)[0] / 127
q_weight_channel = torch.round(weight / scales[:, None])
print("Per-Channel Quantized:\n", q_weight_channel)

总结

  • Per-Tensor:简单、快速,但精度可能低
  • Per-Channel:复杂、存储略多,但精度更高,特别适合权重量化

2 为什么量化对神经网络精度影响不大?

在这里插入图片描述

http://www.dtcms.com/a/515048.html

相关文章:

  • 手机 网站 源码Wordpress标签与分类
  • 网络营销模式包括怎么样优化网站seo
  • 保定网站建设兼职华宇万户网络
  • php网站开发技术描述王府井百货网上商城
  • 在线网站cms识别网站建设费用是多少
  • 怎么在网上注册自己的网站网站内部关键词
  • 3合一网站wordpress国外主题 雅黑
  • 网站页面设计风格西安网站建设维护
  • 怎么修改网站默认首页专门做二手房车的网站
  • 用dw制作网站建设wordpress 本地很慢
  • 营销型网站建设汽车广西网站建设价钱
  • 五合一网站定制中国住房和城乡建设部网站资质查询
  • 58同城推广网站怎么做app开发制作教程
  • 扫码支付做进商城网站重庆市建设工程信息网登录入口
  • 网站建设佰金手指科杰二五企业站seo报价
  • 内蒙古生产建设兵团四师三十四团知青网站开店装修话做那个网站找工人
  • 企业网站html模板下载今天的新闻联播内容
  • 寻找网站建设员上海网站群建设
  • 网站排名提升工具高端网络建站
  • 西安微官网自助建站公司宁波网络推广的公司报价
  • 网站首页的重要性优秀网站首页
  • 网站关键词选取的方法jsp免费建站系统
  • 南昌中小企业网站制作网页广告设计师培训
  • 会议专属网站平台建设报价单怎么做网站策划的模板
  • 网站开发需要哪些人怎么分工西安网站关键词推广
  • 广东衍发建设管理有限公司公司网站企业网站源码简约
  • 网站商城的建设杭州做网站的好公司
  • 非模板网站安溪网页定制
  • 建网站的软件有哪些外贸网站建设熊掌号
  • 响应式网站与自适应域名ip地址在线查询