当前位置: 首页 > news >正文

NNDL 作业三

一、在 Logistic 回归中,是否可以用  \hat{y}=\sigma(w^Tx)去逼近正确的标签 yy,并用平方损失 (y-\hat{y})^2 最小化来优化参数 w?

从理论上讲,用平方损失在分类问题上是可以优化的,但在 Logistic 回归中一般不这么做,原因有:

  1. 损失函数非凸
    使用平方损失时,损失函数对于参数 ww 会变成非凸函数,容易陷入局部极小值,优化困难。

  2. 梯度消失问题
    当预测值 y^y^​ 接近 0 或 1 时,sigmoid 函数的梯度很小,而平方损失的梯度也依赖于 sigmoid 的梯度,这会导致梯度很小,参数更新缓慢。

  3. 概率解释与极大似然
    Logistic 回归通常使用交叉熵损失(或对数损失),这来自于伯努利分布的极大似然估计,它与平方损失相比,对分类问题更合适,收敛更快,且是凸函数。

所以,虽然可以形式上用平方损失,但实际训练效果差,不推荐。

二、在Softmax回归的风险函数R(w)=-\frac{1}{N}\sum_{n=1}^N\sum_{c=1}^Cy^{(n)}\log\hat{y}^{(n)}中,如果加上正则化项会有什么影响?

1.防止过拟合

正则化项一般通过添加一个惩罚系数来实现,这个惩罚系数会让模型在拟合训练数据的同时最小化模型参数的大小,从而避免出现过拟合。在加入正则化项的情况下,Softmax回归的风险函数会在后面增加一个损失项:\frac{1}{2}\|w\|^2

加入正则化项后,优化器在优化模型时除了最小化分类误差,还需要最小化正则化项的值。这样做的目的是平衡模型的复杂度和拟合训练数据的能力。正则化项的存在可以减小模型对训练数据的过拟合现象,提高模型的泛化性能。

通过调整正则化参数λ的值,可以控制正则化项对模型的影响程度。较小的λ值会更关注最小化分类误差,模型可能会更加复杂;而较大的λ值会更加平衡分类误差和正则化项,模型可能会更加简单。

2.减少溢出风险

风险函数求w的偏导:

\frac{\partial{R(W)}}{\partial{W}}=-\frac{1}{N}\sum_{n=1}^N(\hat{y}^{(n)}-y^{(n)})x^{(n)}+\lambda{W}

参数更新:

W=W+\alpha\frac{1}{N}\sum_{n=1}^N(\hat{y}^{(n)}-y^{(n)})x^{(n)}-\lambda{W}

加入正则化后,在更新参数时每次需要减去2\lambda{W},使得参数不会过大,减少溢出的风险。

3.稳定训练过程

正则化可以使优化过程更加稳定,避免因参数过大导致的梯度爆炸等问题,让模型的参数更新更平滑。

参考博客:https://blog.csdn.net/m0_63010299/article/details/133657299?spm=1001.2014.3001.5502

http://www.dtcms.com/a/467166.html

相关文章:

  • 【第三方网站代码登记测试_HTTP头语法代码详解】
  • 怎样建设网站卖农产品dede网站地图制作
  • 【双机位A卷】华为OD笔试之【模拟】双机位A-新学校选址【Py/Java/C++/C/JS/Go六种语言】【欧弟算法】全网注释最详细分类最全的华子OD真题题解
  • 变化型网站网站开发公司 网站空间
  • TDengine 数学函数 ASIN() 用户手册
  • Mysql初阶第五讲:Mysql基本查询
  • 百讯科技网站建设小米应用商店下载
  • 西青集团网站建设wordpress获取网址
  • 做网站 360的好不好公司介绍文案
  • 中英文网站前端怎么做页游源码论坛
  • asp.net程序做的网站安全吗江苏 江苏省住房和城乡建设厅网站
  • 用vs2010做免费网站模板下载地址怎么查询百度收录情况
  • 哪些品牌的实验室移液器值得推荐?如何选择合适的品牌?
  • 网站建设方案图房地产项目营销策划方案
  • 网站制作视频教程新手必看海南建设培训与执业中心网站
  • 购物优惠券网站怎么做深圳网域官网
  • 温州建设银行官方网站西部数码网站管理助手v3.0
  • EHOME视频平台EasyCVR构建全协议、全场景融合的视频监控中枢
  • [数据结构]堆
  • 网站开发应聘问题我想找工作没学历
  • 网站建设指导人员优化方案
  • 基于单片机的±5V数字电压表设计
  • 海口网站建设好做网络推广网站有哪些
  • 天马G前端(TODO)
  • 建立自己网站免费贵州省建设厅网站造价工程信息网
  • 一个新的网站怎么做SEO优化云南高风险地区名单最新
  • 菏泽财富中心网站建设网站建设 完成
  • 软考-系统架构设计师 软件架构复用详细讲解
  • 3.3 可靠数据传输的原理
  • 软考-系统架构设计师 特定领域软件体系结构详细讲解