当前位置：首页 > news >正文

【python深度学习】Day34 GPU训练及类的call方法

news 2025/11/1 6:24:26

查看CPU性能：架构代际、核心数、线程数

提前安装一个库

# pip install wmi -i https://pypi.tuna.tsinghua.edu.cn/simple
# 这是Windows专用的库，Linux和MacOS不支持，其他系统自行询问大模型
# 我想查看一下CPU的型号和核心数
import wmic = wmi.WMI()
processors = c.Win32_Processor()for processor in processors:print(f"CPU 型号: {processor.Name}")print(f"核心数: {processor.NumberOfCores}")print(f"线程数: {processor.NumberOfLogicalProcessors}")

解读cpu配置

Intel 第 12 代酷睿（Alder Lake 架构，2021 年发布）

K：支持超频（解锁倍频）

F：无内置核显（需搭配独立显卡使用）

核心架构：

性能核（P-Core）：8 核（支持超线程，共 16 线程），擅长单线程高性能任务（如游戏、视频剪辑）

能效核（E-Core）：8 核（不支持超线程，共 8 线程），优化多线程能效比（如后台任务、虚拟机）。

查看GPU性能：显存、级别、架构代际

以RTX 3090 Ti, RTX 3080, RTX 3070 Ti, RTX 3070, RTX 4070等为例

（1）前两位数字代表“代”:

40xx (第40代),

30xx (第30代),

20xx (第20代)。

“代”通常指的是其底层的架构 (Architecture)。每一代新架构的发布，通常会带来工艺制程的进步和其他改进。也就是新一代架构的目标是在能效比和绝对性能上超越前一代同型号的产品。

（2）后面的数字代表“级别”，

xx90: 通常是该代的消费级旗舰或次旗舰，性能最强，显存最大 (如 RTX 4090, RTX 3090)。

xx80: 高端型号，性能强劲，显存较多 (如 RTX 4080, RTX 3080)。

xx70: 中高端，甜点级，性能和价格平衡较好 (如 RTX 4070, RTX 3070)。

xx60: 主流中端，性价比较高，适合入门或预算有限 (如 RTX 4060, RTX 3060)。

xx50: 入门级，深度学习能力有限。

（3）后缀Ti : 通常是同型号的增强版，性能介于原型号和更高一级型号之间 (如 RTX 4070 Ti 强于 RTX 4070，小于4080)。

（4）显存容量 VRAM （最重要！！）

GPU 自身的独立高速内存，单位是 GB（例如 8GB, 12GB, 24GB, 48GB）。用于存储模型参数、激活值、输入数据批次等。如果显存不足，可能无法加载模型，或者被迫使用很小的批量大小，从而影响训练速度和效果

GPU训练对比CPU训练

相较于cpu，使用GPU计算多了3个时间上的开销

1. 数据传输开销 (CPU 内存 <-> GPU 显存)

2. 核心启动开销 (GPU 核心启动时间)

3. 性能浪费：计算量和数据批次

类的call方法：为什么定义前向传播时可以直接写作self.fc1(x)

__call__ 方法是一个特殊的魔术方法（双下划线方法），它允许类的实例像函数一样被调用。

# 不带参数的call方法
class Counter:def __init__(self):self.count = 0def __call__(self):self.count += 1return self.count# 使用示例
counter = Counter()
print(counter())  # 输出: 1
print(counter())  # 输出: 2
print(counter.count)  # 输出: 2

# 带参数的call方法
class Adder:def __call__(self, a, b):print("唱跳篮球rap")return a + badder = Adder()
print(adder(3, 5))  # 输出: 8

通过观察上述代码，定义一个类后，没有实例化，直接调用该类，像调用函数一样

查看全文

http://www.dtcms.com/a/209134.html

智能指针

科研经验贴：AI领域的研究方向总结

DAO模式

Java转Go日记（五十六）：gin 渲染

提高 Maven 项目的编译效率

大厂技术大神远程 3 年，凌晨 1 点到 6 点竟开会 77 次。同事一脸震惊，网友：身体还扛得住吗？

matlab时间反转镜算法

Appium+python自动化（四）- 如何查看程序所占端口号和IP

动态防御体系实战：AI如何重构DDoS攻防逻辑

交安安全员：交通工程安全领域的关键角色

DB-GPT扩展自定义Agent配置说明

同为科技领军智能电源分配单元技术，助力物联网与计量高质量发展

Linux安装Nginx并配置转发

WPF性能优化之延迟加载（解决页面卡顿问题）

园区/小区执法仪部署指南：ZeroNews低成本+高带宽方案”

实时操作系统革命：实时Linux驱动的智能时代底层重构

EasyExcel使用

Git全流程操作指南

OS面试篇

SFP与Unsloth：大模型微调技术全解析

Lock锁

Java集合操作：如何避免并发修改异常

ASPICE认证 vs. 其他标准：汽车软件开发的最优选择

互联网大厂Java求职面试：Spring Cloud微服务架构设计中的挑战与解决方案

新能源汽车产业链图谱分析

汽车免拆诊断案例 | 2020款奔驰E300L车发动机故障灯偶尔异常点亮

C 语言学习笔记（指针4）

MySQL 8.0 OCP 英文题库解析（八）

Oracle 的 ALTER DATABASE RECOVER MANAGED STANDBY DATABASE FINISH 命令

Ubuntu16.04 Qt的安装与卸载

查看CPU性能：架构代际、核心数、线程数

查看GPU性能：显存、级别、架构代际

GPU训练对比CPU训练

类的call方法：为什么定义前向传播时可以直接写作self.fc1(x)

相关文章：