当前位置: 首页 > news >正文

深度学习5(深层神经网络 + 参数和超参数)

深层神经网络简介

        深层神经网络是机器学习中一种重要的模型,它通过增加网络的“深度”(即隐藏层的数量)来提升模型对复杂数据的表示和学习能力。同浅层类似,也分为三个部分:

输入层:接收原始数据(如图像像素、文本向量等)。

隐藏层:由多层组成,每一层包含若干神经元(节点),通过权重和激活函数处理数据。

输出层:生成最终预测结果(如分类概率、回归值等)。

深层神经网络正向传播

深层神经网络反向传播

        原理比较容易理解,与浅层神经网络类似,可以分为多个逻辑回归,进行反向传播


参数和超参数

参数(Parameters)

定义

        模型内部学习得到的变量,通过训练数据自动优化,无需人工设定。

        示例

        神经网络中的权重(Weights)偏置(Bias)

        线性回归中的系数(θ0,θ1θ0​,θ1​)。

特点

        数据驱动:通过反向传播(如梯度下降)从数据中学习。

        数量庞大:深层网络的参数量可达数百万甚至数十亿(如GPT-3有1750亿参数)。

        存储于模型中:训练完成后,参数被保存用于预测。

优化目标

        最小化损失函数(如交叉熵、均方误差)。


2. 超参数(Hyperparameters)

定义

        训练前人为设定的配置,控制模型的学习过程或结构。

        示例

        学习率(Learning Rate):梯度下降的步长。

        批量大小(Batch Size):每次迭代使用的样本数。

        网络结构:层数、每层神经元数量。

        正则化参数:L2惩罚系数(λλ)、Dropout率。

        优化器选择:Adam、SGD等。

特点

        人工依赖:无法直接从数据中学习,需通过经验或调优确定。

        影响全局:超参数的选择直接影响模型收敛速度、泛化能力和最终性能。

        需实验验证:通常通过网格搜索、随机搜索或贝叶斯优化确定。

http://www.dtcms.com/a/267597.html

相关文章:

  • Ubuntu 20.04 编译安装FFmpeg及错误分析与解决方案
  • 数据结构:数组:插入操作(Insert)与删除操作(Delete)
  • PageRank:互联网的马尔可夫链平衡态
  • 利用已有的 PostgreSQL 和 ZooKeeper 服务,启动dolphinscheduler-standalone-server3.1.9 镜像
  • Redis基础(6):SpringDataRedis
  • Java创建型模式---工厂模式
  • java多线程--死锁
  • CppCon 2018 学习:Standard Library Compatibility Guidelines (SD-8)
  • 未成功,做个记录,SelfHost.HttpSelfHostServer 如何加载证书
  • 【Prometheus】Grafana、Alertmanager集成
  • 小架构step系列05:Springboot三种运行模式
  • 理想汽车6月交付36279辆 第二季度共交付111074辆
  • 基于微信小程序的校园跑腿系统
  • MySQL——9、事务管理
  • Java-继承
  • 远程协助软件:Git的用法
  • STM32第15天串口中断接收
  • 数据结构:数组抽象数据类型(Array ADT)
  • oracle的内存架构学习
  • Hashcat 最快密码恢复工具实践指南
  • jvm架构原理剖析篇
  • C++ Qt 基础教程:信号与槽机制详解及 QPushButton 实战
  • virtualbox+vagrant私有网络宿主机无法ping通虚拟机问题请教
  • Apache 配置文件提权的实战思考
  • 数据库-元数据表
  • docker容器中Mysql数据库的备份与恢复
  • Java的AI新纪元:Embabel如何引领智能应用开发浪潮
  • 一文讲清楚React中setState的使用方法和机制
  • 应用标签思路参考
  • wsl查看磁盘文件并清理空间