当前位置: 首页 > news >正文

GPU加速与非加速的深度学习张量计算对比Demo,使用PyTorch展示关键差异


import torch
import time

# 创建大型随机张量 (10000x10000)
tensor_size = 10000
x_cpu = torch.randn(tensor_size, tensor_size)
x_gpu = x_cpu.cuda()  # 转移到GPU

# CPU矩阵乘法
start = time.time()
result_cpu = torch.mm(x_cpu, x_cpu.t())
cpu_time = time.time() - start

# GPU矩阵乘法
torch.cuda.synchronize()  # 确保GPU计时准确
start = time.time()
result_gpu = torch.mm(x_gpu, x_gpu.t())
torch.cuda.synchronize()
gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")
print(f"GPU计算时间: {gpu_time:.4f}秒")
print(f"加速比: {cpu_time/gpu_time:.1f}倍")
 

相关文章:

  • Python[数据结构及算法 --- 栈]
  • tcp/udp
  • 6月5日day45
  • Python实现markdown文件转word
  • 六、数据库的安全性
  • 书籍将正方形矩阵顺时针转动90°(8)0605
  • RADIUS-如何获取凭证
  • [蓝桥杯]植树
  • LLaMA.cpp 文本生成惩罚机制详解:从原理到实践的完整指南
  • Spring Bean生命周期全解析:从创建到销毁的底层细节
  • Docker MCP 目录和工具包简介:使用 MCP 为 AI 代理提供支持的简单安全方法
  • Flask+LayUI开发手记(八):通用封面缩略图上传实现
  • 复变函数中的对数函数及其MATLAB演示
  • 深入理解React Hooks的原理与实践
  • RDMA简介5之RoCE v2队列
  • 【高等数学】傅里叶级数逼近例子
  • 将 Jupyter Notebook 的默认存储路径从 C 盘迁移到 D 盘,可以通过以下步骤实现:
  • [密码学实战]彻底理解位(bit)与字节(byte)在十六进制处理中的区别
  • 【EN 18031】访问控制机制(ACM - 3):儿童玩具的防护盾
  • vue:当前对象添加对应值
  • 高端建站骗局/seo排名优化代理
  • 服务器网站建设维护/网站竞价推广托管公司
  • 网站是怎么做的吗/网站外链推广平台
  • 济南室内设计学校/西安seo主管
  • 动漫网站开发毕业设计/2022年今天新闻联播
  • 重庆药师网/seo网站关键词优化软件