当前位置：首页 > news >正文

Python打卡第34天

news 2025/7/10 8:32:42

@浙大疏锦行

作业：

loss.item() 虽然只在 CPU 中执行，但它会触发一次 GPU → CPU 的强制同步，这是影响性能的关键！

`loss.item()` 做了什么？

1. 数据原本在 GPU 上

训练时，loss 是一个 GPU 上的张量（比如 torch.cuda.FloatTensor）。
GPU 可以高效计算，但不能直接读取数值（就像工厂生产产品，但你要亲自去工厂拿货）。

2. .item() 的本质

loss.item() 做了 3 件事：
1. 暂停 GPU 计算：强制 GPU 停下当前所有任务（同步点）。
2. 把数据从 GPU 复制到 CPU（通过 PCIe 总线，就像用卡车从工厂运货到商店）。
3. 转换成 Python 数字（float 或 int），因为 Python 只能处理 CPU 数据。

3. 为什么这么慢？

不是 .item() 本身慢，而是 GPU→CPU 的传输和同步慢！
每次调用 .item()，GPU 都要：
- 等所有并行计算完成（比如 1000 个 CUDA 核心都要停）。
- 走 PCIe 总线（带宽有限，延迟高）。
- 等 CPU 确认收到数据后才能继续计算。

call方法

在 Python 中，__call__ 方法是一个特殊的魔术方法（双下划线方法），它允许类的实例像函数一样被调用。这种特性使得对象可以表现得像函数，同时保留对象的内部状态。

比如：

# 不带参数的call方法
class Counter:def __init__(self):self.count = 0def __call__(self):self.count += 1return self.count# 使用示例
counter = Counter()
print(counter())  # 输出: 1
print(counter())  # 输出: 2
print(counter())  # 输出: 3
print(counter.count)  # 输出: 3

# 带参数的call方法
class Adder:def __call__(self, a, b):print("唱跳篮球rap")return a + badder = Adder()
print(adder(3, 5))  # 输出: 8

唱跳篮球rap
8

为什么 PyTorch 要用 __call__ 而不是直接暴露 forward？

封装性：__call__ 可以统一管理 forward 前后的逻辑（如自动梯度、Hook 机制）。
安全性：防止用户直接调用 forward 导致梯度丢失或计算图断裂。
一致性：让所有模块（nn.Linear、nn.Conv2d、自定义模型）都能用 module(x) 的方式调用。

查看全文

http://www.dtcms.com/a/209633.html

纸牌游戏（基于集合，和自定义排序实现）

MIAOYUN受邀参加“创投天府·周周见”活动，以AI原生技术赋能科创产业新生态

2000-2023年各地级市进出口总额/地级市对外经济贸易数据

Python图像处理基础（四）

【三维重建】【3DGS系列】【深度学习】3DGS的理论基础知识之如何控制高斯椭球

详解osgb的顶点，纹理，索引，UV读取与存储

PyQt学习系列04-多线程与异步编程

3362. 零数组变换 III

Honeywell CV-DINA-DI1624-2A 数字输入模块

【Web前端】JavaScript入门与基础(一)

【软件测试】第三章·软件测试基本方法（逻辑覆盖、路径覆盖）

Redis 缓存使用的BigKey问题

Cesium基础对象介绍

MySQL别名规则与应用场景

矩阵详解：线性代数在AI大模型中的核心支柱

【ICL】上下文学习

英语写作中“假设”suppose, assume, presume 的用法

Arthas（阿尔萨斯）

C++高效求解非线性方程组的实践指南

第一个Python程序

主类网络和无类网络，什么是主类网络边界

5.23 打卡

淘宝卖家评价等级如何区分？如何提升信誉等级？

centos原系统安装了Python3.7.9兼用在安装一个python3.8

【JS】vue3具名导出与默认导出

人工智能在优化算法与大规模求解器中的应用与发展

【论文阅读】Stop Overthinking：高效大模型推理技术综述

详解Mysql的 Binlog、UndoLog 和 RedoLog

交换机的连接方式堆叠和级联

Python 脚本执行命令的深度探索：方法、示例与最佳实践

作业：

loss.item() 做了什么？

__call__方法

相关文章：

`loss.item()` 做了什么？

call方法