当前位置: 首页 > news >正文

深度学习之神经网络(二)

深度学习之神经网络(二)


文章目录

  • 深度学习之神经网络(二)
  • 一、pandas是什么?
  • 神经网络基础:从生物神经元到 PyTorch 全连接网络
    • 1. 生物神经元 vs 人工神经元
    • 2. 从单个神经元到多层网络
      • 2.1 三层标准结构
      • 2.2 张量视角的前向计算
    • 3. PyTorch 组件精讲
      • 3.1 线性层 `nn.Linear`
      • 3.2 激活函数
      • 3.3 损失函数
      • 3.4 优化器
    • 4. 完整示例:搭建并训练 3 层全连接网络
    • 5. 常见问题 & 提示
    • 6. 参考链接


一、pandas是什么?

神经网络基础:从生物神经元到 PyTorch 全连接网络

这篇文章把「什么是神经网络」拆成四部分:

  1. 生物原型 → 2. 数学公式 → 3. 网络结构 → 4. PyTorch 实战。
    读完即可自己搭一个可训练的全连接网络。

1. 生物神经元 vs 人工神经元

在这里插入图片描述

生物术语功能人工神经元对应
树突接收信号输入向量 x = [x₁, x₂, …, xₙ]
细胞核整合并判断是否触发加权和 z = Σ wᵢxᵢ + b,然后通过激活函数 σ
轴突输出信号输出 y = σ(z)
突触调节信号强度权重 wᵢ 和偏置 b(可学习)

激活函数 σ 带来非线性,典型选择:

  • ReLU:max(0, z)
  • Sigmoid:1/(1+e^(−z))
  • Tanh:(e^z − e^(−z))/(e^z + e^(−z))

2. 从单个神经元到多层网络

2.1 三层标准结构

  • 输入层:仅传递数据,不做计算
  • 隐藏层:1 层或多层,每层含若干神经元,负责特征提取
  • 输出层:产生最终预测(1 个神经元做回归,N 个做 N 类分类)

层与层之间 全连接(Fully Connected):上一层的每个神经元都与下一层的每个神经元相连,权重矩阵形状为 (out_features, in_features)

2.2 张量视角的前向计算

设一批样本 x 形状 (batch, in_features),权重 W 形状 (out_features, in_features),偏置 b 形状 (out_features,),则

z = x @ W.T + b        # 线性部分
y = σ(z)               # 激活后输出

3. PyTorch 组件精讲

所有层、激活、损失、优化器都已在 torch.nn / torch.optim 中封装好,直接调用即可。

3.1 线性层 nn.Linear

torch.nn.Linear(in_features, out_features, bias=True)
  • in_features:输入特征维度
  • out_features:输出特征维度
  • bias:是否加偏置(默认 True)

3.2 激活函数

名称类/函数用法示例适用场景
ReLUnn.ReLU()nn.Sequential(nn.Linear(64,32), nn.ReLU())通用默认
LeakyReLUnn.LeakyReLU(0.1)负半轴保留小梯度GAN、避免神经元死亡
Sigmoidnn.Sigmoid()二分类输出层
Softmaxnn.Softmax(dim=1)多分类输出层

3.3 损失函数

任务推荐 API输入要求
回归nn.MSELoss()预测/目标同形状
回归 (对异常值鲁棒)nn.L1Loss()
二分类nn.BCEWithLogitsLoss()网络 需加 Sigmoid
多分类nn.CrossEntropyLoss()网络 需加 Softmax,目标为类别索引

示例:

criterion = nn.CrossEntropyLoss()
loss = criterion(logits, target)   # logits: [B, C], target: [B]

3.4 优化器

torch.optim.SGD(params, lr=0.01, momentum=0.9, weight_decay=1e-4)
torch.optim.Adam(params, lr=1e-3)

通用训练循环:

optimizer.zero_grad()  # 清零梯度
loss.backward()        # 计算梯度
optimizer.step()       # 更新参数

4. 完整示例:搭建并训练 3 层全连接网络

以 32 维输入、单值回归为例:

import torch
from torch import nn, optim# 1. 数据(随机演示)
x = torch.randn(128, 32)
y = torch.randn(128, 1)# 2. 模型
class MLP(nn.Module):def __init__(self):super().__init__()self.net = nn.Sequential(nn.Linear(32, 64),nn.ReLU(),nn.Linear(64, 32),nn.ReLU(),nn.Linear(32, 1))def forward(self, x):return self.net(x)model = MLP()# 3. 损失与优化器
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=1e-3)# 4. 训练 100 步
for step in range(100):pred = model(x)loss = criterion(pred, y)optimizer.zero_grad()loss.backward()optimizer.step()if step % 20 == 0:print(f"step {step:3d} | loss {loss.item():.4f}")

5. 常见问题 & 提示

  1. 权重太多怎么办?
    全连接层参数量 = in_features × out_features + out_features,对高维输入(如图像)改用卷积层 nn.Conv2d

  2. ReLU 死亡神经元?
    尝试 LeakyReLU、PReLU 或更好的初始化(He/Kaiming)。

  3. 过拟合?

    • 加 Dropout nn.Dropout(p=0.5)
    • 权重衰减 weight_decay=1e-4
    • 早停、数据增强
  4. 训练不收敛?

    • 确认学习率过大/过小
    • 检查数据归一化
    • 确认损失函数与任务匹配

6. 参考链接

  • PyTorch nn 文档:https://pytorch.org/docs/stable/nn.html
  • PyTorch optim 文档:https://pytorch.org/docs/stable/optim.html
http://www.dtcms.com/a/284095.html

相关文章:

  • 神经网络常见激活函数 15-B-SiLU 函数
  • OCR 赋能档案数字化:让沉睡的档案 “活” 起来
  • 无线充电技术详解:原理、芯片选型与应用场景
  • Android开发中Retrofit使用方法与底层原理详解
  • 学习设计模式《十八》——备忘录模式
  • 第5天 | openGauss中一个用户可以访问多个数据库
  • 数据分析:从数据到决策的核心逻辑与实践指南
  • 微信小程序地理定位功能
  • SLG 游戏如何进行防破解和防盗版保护?
  • 从 SEO 到 GEO:解锁 AI 时代的搜索优化新机遇
  • 数据结构:集合操作(Set Operations): 并集(Union)、交集(Intersection)、 差集(Difference)
  • HTTP相关知识
  • os.path 常用的使用方法
  • 高光谱相机有多少种类型?分别有什么特点?
  • Odoo最佳业务实践:从库存管理重构到全链路协同
  • 【数据结构】链表(linked list)
  • slot=“trigger“ 覆盖了组件内部的 ref=“trigger“【详细来龙去脉版 5min】
  • 网络服务(设置邮箱发送告警功能,每1分钟发送一封邮件)
  • CMake综合学习1: Cmake的模块化设计
  • vue3实现web端和小程序端个人签名
  • 《迭代器 VS 生成器:Python 惰性计算的两种实现方案详解》
  • Zabbix 分布式监控系统架构设计与优化
  • 硅谷顶级风投发布《2025年AI实战手册》|附下载
  • 芯谷科技--双四通道模拟/数字多路复用器74HC4052
  • Tcpdump使用
  • linux_线程同步
  • 七彩喜跌倒检测仪:用科技编织银发安全的“隐形防护网”
  • 【Mobx】学习笔记
  • Python-多线程编程
  • 时序数据库