当前位置：首页 > news >正文

【动手学深度学习】

news 2025/11/8 8:43:59

def my_init(m):if type(m) == nn.Linear:print("Init", *[(name, param.shape)for name, param in m.named_parameters()][0])nn.init.uniform_(m.weight, -10, 10)m.weight.data *= m.weight.data.abs() >= 5

代码中这里的[0]是列表索引，表示取列表中的第一个元素。

先分解这段代码：

[(name, param.shape) for name, param in m.named_parameters()][0]

代码分解：

m.named_parameters() - 返回模块的所有参数（权重和偏置）及其名称
- 对于 nn.Linear 层，通常返回两个参数：weight 和 bias
列表推导式：

[(name, param.shape) for name, param in m.named_parameters()]

这会生成一个列表，例如：

[('weight', torch.Size([out_features, in_features])), ('bias', torch.Size([out_features]))]

3. [0] - 取列表中的第一（首）个元素：

('weight', torch.Size([out_features, in_features]))

4. *解包 - 将元组解包为单独的参数：

print("Init", *('weight', torch.Size([out_features, in_features])))
# 等价于：
print("Init", 'weight', torch.Size([out_features, in_features]))

输出示例：

# 假设有一个 nn.Linear(10, 5) 层
Init weight torch.Size([5, 10])

为什么只取第一个？

因为对于 nn.Linear 层，通常只需要关注权重（weight）的初始化，偏置（bias）可以使用默认初始化或单独处理。

如果你想看到所有参数，可以去掉 [0]：

print("Init", *[(name, param.shape) for name, param in m.named_parameters()])
# 输出：Init weight torch.Size([5, 10]) bias torch.Size([5])

[0]在这里的作用就是只选择第一(首个)个参数（权重）进行打印和初始化。

查看全文

http://www.dtcms.com/a/581567.html

H2 vs SQLite 全面对比

python+django/flask的城市供水管网爆管预警系统-数据可视化

SQLite 方言解决方案

Jenkins + Docker 打造自动化持续部署流水线

利用DeepSeek改写SQLite版本的二进制位数独求解SQL

python+django/flask的校园活动中心场地预约系统

建设网站公司哪好html5手机网站开发环境

Python高效实现Word转HTML：从基础到进阶的全流程方案

智能驱动，安全可控：EasyGBS平台如何构建企业生产智能监控新模式

建设部网站官网证书查询做网站建设最好学什么

【深度解析】Performance API 与 UKM：从开发者工具到浏览器遥测，全面解锁 Web 性能优化格局

前端项目打包后报错 Uncaught ReferenceError: process is not defined

基于Python的历届奥运会数据可视化分析系统-django+spider

【ZeroRang WebRTC】ICE 在 WebRTC 中的角色与工作原理（深入指南）

计算机视觉（一）：相机标定

OJ项目面经

免费空间领取网站为企业设计网站

邮储政务金融云平台官网地址无法百度

Flutter AnimatedRotation 实现旋转动画

五、CSS盒子模型（下）

网站建设的方法有四种怎样创建公众号

开源项目ruoyi-ai本地部署

乡镇同城O2O系统开发：Java与PHP技术选型对比

google提交网站入口能打开各种网站的搜索引擎

MyBatis完整教程IDEA版(3)--动态SQL/MyBatis缓存

基于Vue的饮食健康管理系统的设计与实现fs9r43tj（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。

linux tomcat注册服务

OpenCV计算机视觉实战（29）——OpenCV DNN模块

基于若依-内容管理动态修改，通过路由字典配置动态管理

中江门户网站中铁建设集团有限公司招投标平台

代码分解：

输出示例：

为什么只取第一个？

相关文章：