当前位置：首页 > news >正文

GPU加速与非加速的深度学习张量计算对比Demo，使用PyTorch展示关键差异

news 2025/8/15 14:55:30

import torch
import time

# 创建大型随机张量 (10000x10000)
tensor_size = 10000
x_cpu = torch.randn(tensor_size, tensor_size)
x_gpu = x_cpu.cuda() # 转移到GPU

# CPU矩阵乘法
start = time.time()
result_cpu = torch.mm(x_cpu, x_cpu.t())
cpu_time = time.time() - start

# GPU矩阵乘法
torch.cuda.synchronize() # 确保GPU计时准确
start = time.time()
result_gpu = torch.mm(x_gpu, x_gpu.t())
torch.cuda.synchronize()
gpu_time = time.time() - start

print(f"CPU计算时间: {cpu_time:.4f}秒")
print(f"GPU计算时间: {gpu_time:.4f}秒")
print(f"加速比: {cpu_time/gpu_time:.1f}倍")

查看全文

http://www.dtcms.com/a/233284.html

Python[数据结构及算法 --- 栈]

tcp/udp

6月5日day45

Python实现markdown文件转word

六、数据库的安全性

书籍将正方形矩阵顺时针转动90°(8)0605

RADIUS-如何获取凭证

[蓝桥杯]植树

LLaMA.cpp 文本生成惩罚机制详解：从原理到实践的完整指南

Spring Bean生命周期全解析：从创建到销毁的底层细节

Docker MCP 目录和工具包简介：使用 MCP 为 AI 代理提供支持的简单安全方法

Flask+LayUI开发手记（八）：通用封面缩略图上传实现

复变函数中的对数函数及其MATLAB演示

深入理解React Hooks的原理与实践

RDMA简介5之RoCE v2队列

【高等数学】傅里叶级数逼近例子

将 Jupyter Notebook 的默认存储路径从 C 盘迁移到 D 盘，可以通过以下步骤实现：

[密码学实战]彻底理解位(bit)与字节(byte)在十六进制处理中的区别

【EN 18031】访问控制机制（ACM - 3）：儿童玩具的防护盾

vue：当前对象添加对应值

Python cryptography【密码库】库功能与使用指南

【Redis】类型补充

墨者学院-密码学实训隐写术第二题

[闭源saas选项]Pinecone：为向量数据库而生的实时语义搜索引擎

【网络安全】XSS攻击

Spring AI（10）——STUDIO传输的MCP服务端

MyBatis-Plus深度全解：从入门到企业级实战

idea json生成实体类

【Git系列】如何同步原始仓库的更新到你的fork仓库？

Spring之事务管理方式

相关文章：