当前位置: 首页 > wzjs >正文

郑州专业建站报价上海外贸seo

郑州专业建站报价,上海外贸seo,重庆招生院校网站,邯郸哪里可以做网站本文介绍机器学习中衡量一个模型计算复杂度的四个指标:MACS、MACs、FLOPS、FLOPs。 首先从含义上讲,可以分类两类:MACS/FLOPS和MACs/FLOPs。MACs/FLOPs表示总的操作数(后缀s可以看成是表示复数),MACS/FLOPS表示每秒可以执行的操作…

本文介绍机器学习中衡量一个模型计算复杂度的四个指标:MACS、MACs、FLOPS、FLOPs。

首先从含义上讲,可以分类两类:MACS/FLOPS和MACs/FLOPs。MACs/FLOPs表示总的操作数(后缀s可以看成是表示复数),MACS/FLOPS表示每秒可以执行的操作数(即:MACs per Second/FLOPs per Second)。

从名称上讲,MAC (Multiply-Accumulate Operation)表示乘加操作,FLOP (Floating Point Operation)表示浮点操作,很容易可以得到一次MAC是两次FLOP,即:FLOPs = 2 × MACs


下面以一个简单的例子,计算模型的MACs:

假设模型是一个三层的FFN模型,每一层的Neuron数都是1024个,输入维数是4,输出维数是2,求这个模型的MACs。


第一层:MACs = 1024×4 = 4096
第二层:MACs = 1024×1024 = 1,048,576
第三层:MACs = 2×1024 = 2048
Total MACs = 4096 + 1,048,576 + 2048 = 1,054,720

我们也可以简单说这个模型的计算复杂度是2 MFLOPs(2×MACs)

在PyTorch中,我们可以使用fvcore第三方库直接得到模型的预估计算复杂度:

import torch
from torchvision.models import resnet50
from fvcore.nn import FlopCountAnalysis# Example model, replace with your model
model = resnet50()# Example input, replace with the appropriate input size for your model
inputs = torch.randn(1, 3, 224, 224)# Calculate FLOPs
flops = FlopCountAnalysis(model, inputs)
print(f"FLOPs: {flops.total()}")

根据复杂度的级数,对应不同FLOPs的称谓:

  • KFLOPs: 10^3 (thousand)
  • MFLOPs: 10^6 (million)
  • GFLOPs: 10^9 (billion)
  • TFLOPs: 10^12 (trillion)

了解以上的概念之后,我们拿到一个模型和一台机器,就能大概评估出这个模型在这台机器上运行的性能。比如说一个模型的计算复杂度是1 GFLOPs,机器CPU的性能是2 GFLOPS,不考虑其他性能损耗,理想状况下这台机器一秒钟可以推理这个模型两次。

最后贴一下NVIDIA一些常见GPU的性能:

    # https://www.techpowerup.com/gpu-specs/h100-pcie-80-gb.c3899"H100": {torch.float32: 51.22e12,  # 51.22 TFLOPS for FP32 on NVIDIA H100torch.float16: 204.9e12,  # 204.9 TFLOPS for FP16 on NVIDIA H100torch.bfloat16: 204.9e12},# https://www.techpowerup.com/gpu-specs/l4.c4091"L4": {torch.float32: 30.29e12,  # 30.29 TFLOPS for FP32 on NVIDIA L4torch.float16: 30.29e12,  # 30.29 TFLOPS for FP16 on NVIDIA L4torch.bfloat16: 30.29e12},# https://www.techpowerup.com/gpu-specs/tesla-t4.c3316"T4": {torch.float32: 8.1e12,  # 8.1 TFLOPS for FP32 on NVIDIA T4torch.float16: 65.13e12,  # 65.13 TFLOPS for FP16 on NVIDIA T4torch.bfloat16: 65.13e12},# https://www.techpowerup.com/gpu-specs/a10g.c3798"A10G": {torch.float32: 31.52e12,  # 31.52 TFLOPS for FP32 on NVIDIA A10Gtorch.float16: 31.52e12,  # 31.52 TFLOPS for FP16 on NVIDIA A10Gtorch.bfloat16: 31.52e12},# https://www.techpowerup.com/gpu-specs/a100-pcie-40-gb.c3623"A100": {torch.float32: 19.49e12,  # 19.49 TFLOPS for FP32 on NVIDIA A100torch.float16: 77.97e12,  # 77.97 TFLOPS for FP16 on NVIDIA A100torch.bfloat16: 77.97e12},# https://www.techpowerup.com/gpu-specs/geforce-rtx-3080.c3621"RTX_3080": {torch.float32: 29.77e12,  # 29.77 TFLOPS for FP32 on NVIDIA RTX 3080torch.float16: 29.77e12,  # 29.77 TFLOPS for FP16 on NVIDIA RTX 3080torch.bfloat16: 29.77e12},# https://www.techpowerup.com/gpu-specs/geforce-rtx-3090.c3622"RTX_3090": {torch.float32: 35.58e12,  # 35.58 TFLOPS for FP32 on NVIDIA RTX 3090torch.float16: 35.58e12,  # 35.58 TFLOPS for FP16 on NVIDIA RTX 3090torch.bfloat16: 35.58e12}
http://www.dtcms.com/wzjs/177.html

相关文章:

  • 购物网站策划建设方案seo推广视频隐迅推专业
  • 做网站开发面临的困难看seo
  • 网站添加漂浮二维码怎么做seo网上培训多少钱
  • 网站建设如何制作教程如何做google推广
  • 做俄语网站建设新的数据新闻
  • 做网站时候那个页面都是单独的吗windows7优化大师下载
  • 定制型网站制作明细报价表今日军事新闻
  • 网站建设应该应聘什么岗位北京网站建设制作开发
  • 网站手机css模板下载营销网站建设规划
  • 商城开发网站建设公司seo是什么级别
  • 太原网站建设哪家好发外链平台
  • 江西建设厅培训网站霸屏seo服务
  • 广东网页设计网站首页关键词怎么排名靠前
  • 怎样成立一个网站秦皇岛seo排名
  • 谁做违法网站宁波网站建设
  • 推进政务服务网站一体化建设whois查询
  • 做网站公司郑州郑州的网站建设公司百度地图推广
  • 北京高端网站建设公司哪家好软文内容
  • 营销型网站是啥想学手艺在哪里可以培训
  • 东莞有什么做网站的公司抖音流量推广神器软件
  • 网站标题怎么做链接哪里可以学seo课程
  • 中山骏域网站建设专家网络营销的目的和意义
  • 东北做美甲的贷款在线播放英文网站抖音优化公司
  • 哈尔滨网站开发电话免费行情网站的推荐理由
  • dede跳转到其他网站怎样制作一个网页
  • 网站服务公司免费建站网站大全
  • 做图片网站咋样关键词投放
  • 陕西省人民政府门户网站长沙免费网站建站模板
  • 做网站建设优化的公司排名免费二级域名建站
  • 建设部执业资格注册中心网站四平网络推广