当前位置: 首页 > news >正文

深度学习2(逻辑回归+损失函数+梯度下降)

目录

逻辑回归

逻辑回归损失函数

梯度下降算法


逻辑回归

        在深度学习中,逻辑回归(Logistic Regression)是一种经典的二分类算法,同时也是神经网络的基础组件之一。

        其作用是将输入特征的线性组合(x)通过一个非线性函数(Sigmoid)映射到 [0,1] 区间,表示属于某一类的概率。

回归函数公式

\hat{y}=P(y=1|x)=\sigma (W^{T}+b)=\cfrac{1}{1 + e^{-(W^{T}+b) } }

x 是输入特征向量

w 是权重

b 是偏置

sigmoid函数图像


逻辑回归损失函数

        损失函数(lossfunction)用于衡量预测结果与真实值之间的误差。

        逻辑回归的损失函数交叉熵损失(Cross-Entropy Loss),它是衡量模型预测概率分布与真实标签分布之间差异的关键工具。

逻辑回归的损失函数公式

L(\hat{y},y )=-y\log_{}{\hat{y}}-(1-y)\log_{}{(1-\hat{y})}

        注:在机器学习和深度学习的损失函数中,对数函数(log)默认以自然对数(底数为 e) 为底,即数学中的 ln⁡。

        如果真实值y=1,则L(\hat{y},y )=-\log_{}{\hat{y}},此时想要损失越小,预测值需要约趋近于1

        如果真实值y=0,L(\hat{y},y )=-\log_{}{(1-\hat{y})},此时想要损失越小,预测值需要约趋近于0

        以上是单个样本的损失值计算,而总体平均损失值(又称代价函数)公式为:

J(w,b)=\frac{1}{n} \sum_{i=1}^{n} L(\hat{y}_{i},y_{i})


梯度下降算法

        目的:找到使损失函数最小的值

        函数的梯度(gradient)指出了函数的最陡增长方向。梯度的方向走,函数增长得就越快。那么按梯度的负方向走,函数值自然就降低得最快了。

        模型的训练目标即是寻找合适的w与b以最小化代价函数值。假设w与b都是一维实数,那么可以得到如下的J关于w与b的图:

        可以看到,成本函数J是一个凸函数,其含有局部最低。可以通过迭代调整参数沿着损失函数的负梯度方向逐步更新,使损失函数值减小。


参数w和b的更新公式

w=w -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} w}

b=b -\alpha \frac{\mathrm{d} J(w,b)}{\mathrm{d} b}

注:其中a表示学习速率,即每次更新的w的步伐长度。当w大于最优解 w'时,导数大于 0,那么 w
就会向更小的方向更新。反之当 w 小于最优解 w' 时,导数小于 0,那么 w 就会向更大的方向更新。迭代直到收敛。

http://www.dtcms.com/a/265532.html

相关文章:

  • 基于Spring Boot + MyBatis-Plus + Thymeleaf的评论管理系统深度解析
  • Spring Boot + Screw 一键生成数据库设计文档
  • GitHub 解码指南:用 AI 赋能,五步快速掌握任意开源项目
  • WordPress 站点漏洞利用:数据库恶意注入与多重感染的案例分析
  • 大数据环境搭建指南:基于 Docker 构建 Hadoop、Hive、HBase 等服务
  • 如何在Jupyter notebook中删除内核以及添加内核
  • 大数据救公益:数字时代下的社会力量如何玩转“数据+善意”
  • CSS之基础语法一文全解析
  • 大语言模型(LLM)按架构分类
  • 小黑黑日常积累大模型prompt句式2:【以段落的形式输出,不分点列举】【如果没有相关内容则不输出】【可读性强】【输出格式规范】
  • 音视频会议服务搭建(设计方案-Go服务端API业务逻辑流程图)-04
  • js随机生成一个颜色
  • Python 机器学习核心入门与实战进阶 Day 1 - 分类 vs 回归
  • 【Linux】Rocky Linux 安装 Jenkins
  • Jenkins 构建过程常见错误
  • serviceWorker缓存资源
  • 项目——视频共享系统测试
  • 多线程(进阶)
  • PTA N个数求和
  • 基于Hadoop的京东厨具商品数据分析及商品价格预测系统的设计与实现
  • GoFastDFS:轻量级高性能分布式文件存储解决方案(Linux安装部署)
  • 云端SaaS医院信息系统源码,融合四级电子病历,基于云计算的医院信息系统
  • 【2.3 漫画SpringSecurity - 守护应用安全的钢铁卫士】
  • List中的对象进行排序处理
  • SpringBoot + LiteFlow实现流程编排
  • 苹果手机扫描PDF:整理课堂笔记、保存重要文件
  • 解锁高难度PDF!MinerU部署保姆教程 + Dify联合解析《少年百科》
  • OpenCV CUDA模块设备层-----在 GPU 上执行类似于 std::copy 的操作函数warpCopy()
  • gateway断言配置详解
  • Web基础关键_007_JavaScript 的 DOM