当前位置：首页 > news >正文

PyTorch 模型评估与全局平均池化的应用实践

news 2025/9/28 7:49:12

在深度学习流程中，模型评估是检验训练效果的关键环节，而网络结构优化（如引入全局平均池化）则是提升模型性能与效率的核心手段。本文结合 PyTorch 代码，从 “模型整体准确率测试”“各类别准确率分析” 到 “全局平均池化的应用与优势”，逐步展开实践讲解。

一、模型测试：计算整体准确率

训练完成后，需在独立的测试集上验证模型性能。以下是使用 PyTorch 计算整体准确率的核心代码与解析：

correct = 0
total = 0
# 禁用梯度计算（测试阶段无需反向传播，节省内存+加速）
with torch.no_grad():for data in testloader:images, labels = data# 数据与标签移至目标设备（CPU/GPU）images, labels = images.to(device), labels.to(device)# 模型前向传播，得到类别输出outputs = net(images)# 取每个样本输出最大值的“索引”（即预测类别）_, predicted = torch.max(outputs.data, 1)# 累计样本总数（labels.size(0)为当前批次样本数）total += labels.size(0)# 累计预测正确的样本数（逐元素比较后求和）correct += (predicted == labels).sum().item()# 打印整体准确率
print('Accuracy of the network on the 10000 test images: %d %%' % (100 * correct / total))

代码关键逻辑：

torch.no_grad()：上下文管理器，临时关闭梯度计算，避免测试阶段的不必要计算与内存消耗。
torch.max(outputs.data, 1)：在 “类别维度（dim=1）” 上取最大值，返回 “最大值” 和 “最大值的索引”，这里索引就是预测的类别。
(predicted == labels).sum().item()：逐元素比较 “预测类别” 与 “真实标签”，True 记为 1、False 记为 0，求和后通过item()转换为 Python 原生数值，得到当前批次的 “正确数”。

运行结果显示：模型在 10000 张测试图像上的整体准确率为66%。但 “整体准确率” 无法体现模型在不同类别上的性能差异，因此需要进一步分析 “各类别准确率”。

二、各类别准确率分析：挖掘模型 “偏科” 现象

为了更细致地评估模型，需统计每个类别的准确率（即模型在某一类样本上的预测能力）。代码如下：

# 初始化“每个类别正确数”和“每个类别总数”的列表（假设共10类）
class_correct = list(0. for i in range(10))
class_total = list(0. for i in range(10))
with torch.no_grad():for data in testloader:images, labels = dataimages, labels = images.to(device), labels.to(device)outputs = net(images)_, predicted = torch.max(outputs, 1)# 压缩张量维度，方便逐样本判断（将形状为(batch,1)的张量压缩为(batch,)）c = (predicted == labels).squeeze()for i in range(4):  # 假设每个批次含4个样本，需根据实际batch_size调整label = labels[i]# 累计当前类别下的“正确数”与“总数”class_correct[label] += c[i].item()class_total[label] += 1# 打印每个类别的准确率
for i in range(10):print('Accuracy of %5s : %2d %%' % (classes[i], 100 * class_correct[i] / class_total[i]))

结果与分析：

运行后得到每个类别的准确率（以 CIFAR-10 数据集为例）：

plane（飞机）：72%
car（汽车）：82%
bird（鸟类）：51%
cat（猫）：45%

可以发现：模型在 “汽车” 类别上表现最好（准确率 82%），但在 “猫” 类别上表现较差（仅 45%）。这种 “偏科” 现象为后续优化指明方向（如增加 “猫” 类样本、调整网络对该类特征的提取能力）。

三、全局平均池化：让模型更高效、更鲁棒

传统 CNN 常使用全连接层连接 “特征提取” 与 “分类输出”，但全连接层存在 “参数多、易过拟合、依赖固定特征图尺寸” 等问题。全局平均池化（Global Average Pooling, GAP） 是一种更优的替代方案，能有效解决这些痛点。

3.1 全局平均池化的原理

全局平均池化会对每个特征图的所有元素取平均值，将特征图压缩为单个数值。例如：若某层输出是形状为 [batch_size, 36, 5, 5] 的特征图，经过全局平均池化后，会变成 [batch_size, 36, 1, 1]；再展平后，可直接输入分类层。

相比全连接层，全局平均池化的优势的是：

参数更少：无需学习大量全连接权重，降低过拟合风险。
泛化性更强：不依赖固定的特征图尺寸，更灵活。
更具解释性：每个特征图的平均值可直接对应 “某类特征的存在概率”。

3.2 代码实现：用 GAP 替换全连接层

以下是引入全局平均池化的网络结构代码（基于 CIFAR-10 任务）：

import torch.nn as nn
import torch.nn.functional as F# 自动选择设备（GPU优先）
device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")class Net(nn.Module):def __init__(self):super(Net, self).__init__()# 特征提取部分：卷积层 + 最大池化层self.conv1 = nn.Conv2d(3, 16, 5)   # 输入通道3，输出通道16，卷积核5x5self.pool1 = nn.MaxPool2d(2, 2)    # 最大池化，核2x2，步长2self.conv2 = nn.Conv2d(16, 36, 5)  # 输入通道16，输出通道36，卷积核5x5self.pool2 = nn.MaxPool2d(2, 2)    # 最大池化，核2x2，步长2# 替换传统全连接层：全局平均池化 + 轻量全连接self.gap = nn.AdaptiveAvgPool2d(1)  # 全局平均池化，输出尺寸1x1self.fc3 = nn.Linear(36, 10)        # 36个GAP后的特征 → 10类输出def forward(self, x):# 特征提取流程x = self.pool1(F.relu(self.conv1(x)))x = self.pool2(F.relu(self.conv2(x)))# 全局平均池化x = self.gap(x)# 展平特征（batch_size, 36*1*1）x = x.view(x.size(0), -1)# 分类输出x = self.fc3(x)return x# 初始化模型并移至目标设备
net = Net()
net = net.to(device)

结构对比：

传统结构：常使用大参数的全连接层（如 nn.Linear(10 * 5 * 5, 120)），不仅参数多，还要求特征图尺寸固定（需与10*5*5匹配）。
GAP 结构：通过 AdaptiveAvgPool2d(1) 自动压缩特征图为1x1，后续全连接层（nn.Linear(36, 10)）参数极少，且不依赖特征图原始尺寸。

3.3 参数数量对比：模型 “轻量化” 的直观体现

通过统计网络总参数数量，可直观感受全局平均池化的 “轻量化” 优势：

# 统计所有参数数量并打印
print("net_gap have {} parameters in total".format(sum(x.numel() for x in net.parameters())))

运行结果显示：新网络总参数为16022，相比传统全连接层结构，参数数量大幅减少。这意味着模型更 “轻量”，训练 / 推理速度更快，且更难过拟合。

四、总结

本文通过 PyTorch 实践，完成了从 “模型整体评估” 到 “网络结构优化” 的完整流程：

整体准确率测试：用torch.no_grad()+torch.max()快速验证模型在测试集的整体性能。
各类别准确率分析：细化评估粒度，挖掘模型在不同类别上的 “偏科” 问题，为优化提供方向。
全局平均池化的应用：以 GAP 替代部分全连接层，实现 “减少参数、增强泛化、提升效率” 的目标。

深度学习是 “迭代优化” 的过程：通过评估发现问题，通过结构优化解决问题，最终得到更优的模型。希望本文的实践能为你的项目提供参考～

查看全文

http://www.dtcms.com/a/415064.html

什么是大型门户网站软件开发公司app

构建AI智能体：四十六、Codebuddy MCP 实践：用高德地图搭建旅游攻略系统

Sychronized和ReentrantLock的区别

【mdBook】4 mdBook 命令行工具详解

在 Kali Linux 上配置 MySQL 服务器并实现 Windows 远程连接

记录在vps上搭建Rocket.Chat实现centos系统和手机android通联（一）

档案网站建设外包公司vue seo 优化方案

推广营销方式有哪些wordpress百度seo插件

Scikit-learn Python机器学习 - 聚类分析算法 - K-Means（K均值）

Spring Boot 配置类注解@Configuration详解：从基础到实战

python怎么做网站建站工具评测 discuz

ReAct 框架

网站怎么做301重定向如何把做的网站发布到网上

网站维护公司苏宁网站建设

2.1 通信基础 (答案见原书 P38)

(附源码)基于Spring Boot的宿舍管理系统设计与实现0007

【FreeRTOS】第七课（4）：任务间的通信——一个设备的数据写入多个队列

js的this—13

从“全量”到“增量”：Diff解析器如何彻底优化数据处理效率？

steamGame——饥荒联机版（2025）

网站服务器连接被重置中网可信网站查询

【Qt】Windows下Qt+MSVC的使用

STL容器：vector

网站什么时候备案好wordpress 新浪博客模板

嵌入式面试高频（十二）！！！C++语言（嵌入式八股文，嵌入式面经）c++11新特性

iptables 详解

基于dify搭建的论文查询和内容提取应用（可加群）

elasticsearch面试八股文

MySQL笔记---表的约束

单页产品网站源码带后台东莞全网推广