当前位置: 首页 > news >正文

理解神经网络流程

个人记录 2025 10 3
神经网络流程
数据的预处理 通过dataset和dataloader进行
dataset 处理数据旋转裁切调整对比度等操作 将数据修改成张量的格式 就像numpy 用array格式,pandas用的是dataframe格式
dataloader 处理数据如果批次大小和加载数量,因为他不像机器学习可以把数据一次性读进来。
前向传播   样本特征输入后进行预测,通过损失函数中参数权重偏置进行链式求导法则得到梯度,用梯度下降法更新参数
循环  最终使得梯度平稳停止。


 神经网络核心流程梳理(dbai总结版)

一、数据预处理:给模型“备齐能用的料”

- 核心目的:把原始数据(图、文等)变成模型能“消化”且训练效果好的形式

- Dataset:干“数据加工”的活

- 先优化数据:做旋转、裁切、调对比度,让模型见多识广(提升泛化能力)

- 再统一格式:把加工好的数据转成张量(Tensor),比NumPy的Array多了GPU加速功能

- DataLoader:干“按需上菜”的活

- 分批拆数据:按设好的Batch Size拆分,解决“数据太多装不下内存”的问题

- 按次给数据:训练时每次只送一批,贴合神经网络的训练节奏

二、核心训练循环:模型“慢慢学”的关键步骤

1. 前向传播:把DataLoader给的一批数据喂进模型,经过卷积、全连接这些层计算后,得出预测结果

2. 算损失:用交叉熵、MSE这类损失函数,比一比预测结果和真实答案差多少,得出误差(损失值)

3. 反向传播:根据损失值,用链式求导法则从后往前算,找出每个参数(权重、偏置)对误差的影响(梯度)

4. 更参数:让SGD、Adam这些优化器照着梯度,用梯度下降法调整参数,争取下一轮误差能变小

三、训练停止:判断模型“学好了”的标准

- 看损失:损失值不怎么降了,稳定在一个区间里

- 看梯度:参数的梯度快接近0了,再调参数也没多大提升空间

- 看轮次:训练到了提前设好的Epoch数,就停下


为什么要收敛,如何收敛,如何快速收敛
要将梯度值控制在0-1的范围内防止梯度消失和梯度爆炸等问题
通过反向传播进行循环计算损失函数的权重和偏置来得到梯度,再用梯度下降来解决
使用优秀的优化器比如adam自适应距估计和sgd随机梯度下降,通常使用adam 

 

http://www.dtcms.com/a/438125.html

相关文章:

  • 2025年渗透测试面试题总结-99(题目+回答)
  • Linux启动流程与字符设备驱动详解 - 从bootloader到驱动开发
  • 探讨区块链与生物识别技术融合的安全解决方案
  • 手机应用商店app下载官方网站下载建设厅网站技术负责人要求
  • 电子商务网站开发过程论文6保定网站建设哪家好
  • Lua语法
  • stm32摇杆adc数据分析
  • 公司网站开发费用如何做账网站三合一建设
  • MySQL 进阶知识点(十二)---- 管理
  • C/C++贪吃蛇小游戏
  • 【Linux】多线程创建及封装
  • 苏州网站推广公司创业商机网餐饮
  • unity 读取PPT显示到屏幕功能
  • Django - 让开发变得简单高效的Web框架
  • C# 判断语句详解
  • 新建一个网站需要多少钱舟山专业做网站
  • JVM中的垃圾回收机制
  • 【计算机视觉】概述
  • 【第五章:计算机视觉-项目实战之生成对抗网络实战】2.基于SRGAN的图像超分辨率实战-(2)实战1:DCGAN模型搭建
  • 【精品资料鉴赏】大型企业网络安全整体解决方案
  • 重庆建设医院官方网站wordpress中文社区
  • [优选算法专题三.二分查找——NO.23搜索旋转排序数组中的最⼩值]
  • 【个人修养】商务礼仪教程
  • 报告派研读:2025年全球PC/主机游戏洞察报告
  • 用jquery做的书籍网站discuz做服务网站
  • Linux 驱动开发入门:LCD 驱动与内核机制详解
  • [Linux基础——Lesson9.调试器GDB]
  • 网站 推送中国万网域名官网
  • 主窗口(QMainWindow)如何放入文本编辑器(QPlainTextEdit)等继承自QWidget的对象--(重构版)
  • 和 AI 一起修 Bug 心得体会