当前位置: 首页 > news >正文

大数据和网站建设品牌餐饮加盟网站建设

大数据和网站建设,品牌餐饮加盟网站建设,性能网站建设,asp网站缺点本文介绍机器学习中衡量一个模型计算复杂度的四个指标:MACS、MACs、FLOPS、FLOPs。 首先从含义上讲,可以分类两类:MACS/FLOPS和MACs/FLOPs。MACs/FLOPs表示总的操作数(后缀s可以看成是表示复数),MACS/FLOPS表示每秒可以执行的操作…

本文介绍机器学习中衡量一个模型计算复杂度的四个指标:MACS、MACs、FLOPS、FLOPs。

首先从含义上讲,可以分类两类:MACS/FLOPS和MACs/FLOPs。MACs/FLOPs表示总的操作数(后缀s可以看成是表示复数),MACS/FLOPS表示每秒可以执行的操作数(即:MACs per Second/FLOPs per Second)。

从名称上讲,MAC (Multiply-Accumulate Operation)表示乘加操作,FLOP (Floating Point Operation)表示浮点操作,很容易可以得到一次MAC是两次FLOP,即:FLOPs = 2 × MACs


下面以一个简单的例子,计算模型的MACs:

假设模型是一个三层的FFN模型,每一层的Neuron数都是1024个,输入维数是4,输出维数是2,求这个模型的MACs。


第一层:MACs = 1024×4 = 4096
第二层:MACs = 1024×1024 = 1,048,576
第三层:MACs = 2×1024 = 2048
Total MACs = 4096 + 1,048,576 + 2048 = 1,054,720

我们也可以简单说这个模型的计算复杂度是2 MFLOPs(2×MACs)

在PyTorch中,我们可以使用fvcore第三方库直接得到模型的预估计算复杂度:

import torch
from torchvision.models import resnet50
from fvcore.nn import FlopCountAnalysis# Example model, replace with your model
model = resnet50()# Example input, replace with the appropriate input size for your model
inputs = torch.randn(1, 3, 224, 224)# Calculate FLOPs
flops = FlopCountAnalysis(model, inputs)
print(f"FLOPs: {flops.total()}")

根据复杂度的级数,对应不同FLOPs的称谓:

  • KFLOPs: 10^3 (thousand)
  • MFLOPs: 10^6 (million)
  • GFLOPs: 10^9 (billion)
  • TFLOPs: 10^12 (trillion)

了解以上的概念之后,我们拿到一个模型和一台机器,就能大概评估出这个模型在这台机器上运行的性能。比如说一个模型的计算复杂度是1 GFLOPs,机器CPU的性能是2 GFLOPS,不考虑其他性能损耗,理想状况下这台机器一秒钟可以推理这个模型两次。

最后贴一下NVIDIA一些常见GPU的性能:

    # https://www.techpowerup.com/gpu-specs/h100-pcie-80-gb.c3899"H100": {torch.float32: 51.22e12,  # 51.22 TFLOPS for FP32 on NVIDIA H100torch.float16: 204.9e12,  # 204.9 TFLOPS for FP16 on NVIDIA H100torch.bfloat16: 204.9e12},# https://www.techpowerup.com/gpu-specs/l4.c4091"L4": {torch.float32: 30.29e12,  # 30.29 TFLOPS for FP32 on NVIDIA L4torch.float16: 30.29e12,  # 30.29 TFLOPS for FP16 on NVIDIA L4torch.bfloat16: 30.29e12},# https://www.techpowerup.com/gpu-specs/tesla-t4.c3316"T4": {torch.float32: 8.1e12,  # 8.1 TFLOPS for FP32 on NVIDIA T4torch.float16: 65.13e12,  # 65.13 TFLOPS for FP16 on NVIDIA T4torch.bfloat16: 65.13e12},# https://www.techpowerup.com/gpu-specs/a10g.c3798"A10G": {torch.float32: 31.52e12,  # 31.52 TFLOPS for FP32 on NVIDIA A10Gtorch.float16: 31.52e12,  # 31.52 TFLOPS for FP16 on NVIDIA A10Gtorch.bfloat16: 31.52e12},# https://www.techpowerup.com/gpu-specs/a100-pcie-40-gb.c3623"A100": {torch.float32: 19.49e12,  # 19.49 TFLOPS for FP32 on NVIDIA A100torch.float16: 77.97e12,  # 77.97 TFLOPS for FP16 on NVIDIA A100torch.bfloat16: 77.97e12},# https://www.techpowerup.com/gpu-specs/geforce-rtx-3080.c3621"RTX_3080": {torch.float32: 29.77e12,  # 29.77 TFLOPS for FP32 on NVIDIA RTX 3080torch.float16: 29.77e12,  # 29.77 TFLOPS for FP16 on NVIDIA RTX 3080torch.bfloat16: 29.77e12},# https://www.techpowerup.com/gpu-specs/geforce-rtx-3090.c3622"RTX_3090": {torch.float32: 35.58e12,  # 35.58 TFLOPS for FP32 on NVIDIA RTX 3090torch.float16: 35.58e12,  # 35.58 TFLOPS for FP16 on NVIDIA RTX 3090torch.bfloat16: 35.58e12}
http://www.dtcms.com/a/533719.html

相关文章:

  • 做企业规划的网站现在有专业做海鲜的网站没有
  • 【020】使用Google Test进行 C++ 单元测试:基于 CMake 和 FetchContent 的现代方法
  • 展开网站建设商城网站前台模板
  • 个人建站 wordpressuml电子商务网站建设文档
  • 做软件的网站phpwordpress防采集
  • 网站正在建设中 html 模板何做好网站建设销售
  • 数据库第三次项目实战
  • 合肥外贸网站建设公司排名网站建设项目实训报告
  • 免费网站的资源可以发公众号吗做产品表情的网站
  • Sdl窗口实现web view
  • 广东建设中标网站朝阳住房和城乡建设厅网站
  • dw做简易表格网站免费英文 网站模板
  • 微网站开发流程网页制作软件山水
  • 卢氏县网站建设推广深圳找做网站
  • dede模板蓝色大气简洁企业网站模板苏州哪家公司做网站
  • 【工业树莓派CM0 Dev Board】AI视觉应用部署方案:人脸检测
  • 网站建设报价单表格网站文章更新时间
  • 摄影网站源代码wordpress底部怎么改
  • 深圳设计功能网站免费搭建wordpress
  • 海南网站制作精准数据营销方案
  • 网站技术建设维护技术论文如何推广网店
  • ros2 launch 常用python模块详细使用范例
  • Spring AOP XML配置实战:传统方式的进阶应用与对比分析(含核心关键词)
  • 映像星球官网网页版入口 - 最新影视资源高清在线观看平台
  • 如何评判一个网站建设的怎么样怎么用html做移动网站吗
  • 苏州网站建设网站开发庐江网站建设
  • 1.6 大数据方法论与实践指南-数据治理工具
  • 基于python大数据的台风灾害分析及预测系统
  • 城乡住房建设网站手机网站最小宽度
  • 华为OD算法开发指导-比赛的冠亚季军