当前位置：首页 > news >正文

理解神经网络流程

news 2025/10/4 5:37:17

个人记录 2025 10 3
神经网络流程
数据的预处理通过dataset和dataloader进行
dataset 处理数据旋转裁切调整对比度等操作将数据修改成张量的格式就像numpy 用array格式，pandas用的是dataframe格式
dataloader 处理数据如果批次大小和加载数量，因为他不像机器学习可以把数据一次性读进来。
前向传播样本特征输入后进行预测，通过损失函数中参数权重偏置进行链式求导法则得到梯度，用梯度下降法更新参数
循环最终使得梯度平稳停止。

神经网络核心流程梳理（dbai总结版）

一、数据预处理：给模型“备齐能用的料”

- 核心目的：把原始数据（图、文等）变成模型能“消化”且训练效果好的形式

- Dataset：干“数据加工”的活

- 先优化数据：做旋转、裁切、调对比度，让模型见多识广（提升泛化能力）

- 再统一格式：把加工好的数据转成张量（Tensor），比NumPy的Array多了GPU加速功能

- DataLoader：干“按需上菜”的活

- 分批拆数据：按设好的Batch Size拆分，解决“数据太多装不下内存”的问题

- 按次给数据：训练时每次只送一批，贴合神经网络的训练节奏

二、核心训练循环：模型“慢慢学”的关键步骤

1. 前向传播：把DataLoader给的一批数据喂进模型，经过卷积、全连接这些层计算后，得出预测结果

2. 算损失：用交叉熵、MSE这类损失函数，比一比预测结果和真实答案差多少，得出误差（损失值）

3. 反向传播：根据损失值，用链式求导法则从后往前算，找出每个参数（权重、偏置）对误差的影响（梯度）

4. 更参数：让SGD、Adam这些优化器照着梯度，用梯度下降法调整参数，争取下一轮误差能变小

三、训练停止：判断模型“学好了”的标准

- 看损失：损失值不怎么降了，稳定在一个区间里

- 看梯度：参数的梯度快接近0了，再调参数也没多大提升空间

- 看轮次：训练到了提前设好的Epoch数，就停下

为什么要收敛，如何收敛，如何快速收敛
要将梯度值控制在0-1的范围内防止梯度消失和梯度爆炸等问题
通过反向传播进行循环计算损失函数的权重和偏置来得到梯度，再用梯度下降来解决
使用优秀的优化器比如adam自适应距估计和sgd随机梯度下降，通常使用adam

http://www.dtcms.com/a/438125.html

相关文章：

2025年渗透测试面试题总结-99（题目+回答）

Linux启动流程与字符设备驱动详解 - 从bootloader到驱动开发

探讨区块链与生物识别技术融合的安全解决方案

手机应用商店app下载官方网站下载建设厅网站技术负责人要求

电子商务网站开发过程论文6保定网站建设哪家好

Lua语法

stm32摇杆adc数据分析

公司网站开发费用如何做账网站三合一建设

MySQL 进阶知识点（十二）---- 管理

C/C++贪吃蛇小游戏

【Linux】多线程创建及封装

苏州网站推广公司创业商机网餐饮

unity 读取PPT显示到屏幕功能

Django - 让开发变得简单高效的Web框架

C# 判断语句详解

新建一个网站需要多少钱舟山专业做网站

JVM中的垃圾回收机制

【计算机视觉】概述

【第五章:计算机视觉-项目实战之生成对抗网络实战】2.基于SRGAN的图像超分辨率实战-(2)实战1：DCGAN模型搭建

【精品资料鉴赏】大型企业网络安全整体解决方案

重庆建设医院官方网站wordpress中文社区

[优选算法专题三.二分查找——NO.23搜索旋转排序数组中的最⼩值]

【个人修养】商务礼仪教程

报告派研读：2025年全球PC／主机游戏洞察报告

用jquery做的书籍网站discuz做服务网站

Linux 驱动开发入门：LCD 驱动与内核机制详解

[Linux基础——Lesson9.调试器GDB]

网站推送中国万网域名官网

主窗口(QMainWindow)如何放入文本编辑器(QPlainTextEdit)等继承自QWidget的对象--(重构版)

和 AI 一起修 Bug 心得体会