当前位置: 首页 > wzjs >正文

上海 网站设计 排名免流服务器

上海 网站设计 排名,免流服务器,有哪些网站可以免费看电影,网站推广的英文content文章目录为什么需要正则化过拟合与欠拟合对比表正则化---为了防止过拟合逻辑回归的L1与L2正则化L2正则化 w2w^2w2L1正则化 www梯度下降为什么需要正则化 这里引入一些概念 偏差:预测与实际值差的大,训练集,测试集都不准。方差:受…

在这里插入图片描述

文章目录

为什么需要正则化

这里引入一些概念

  1. 偏差:预测与实际值差的大,训练集,测试集都不准。
  2. 方差:受数据的扰动大,训练集数据差别大(方差大),导致相同模型,不同训练集,预测的结果不同。(训练集准,测试集不准)
  3. 过拟合:训练参数过多,而训练样本过少导致学习了无用特征,使预测集准确率低。
  4. 欠拟合:训练集,测试集准确率都低。(偏差大)

过拟合与欠拟合对比表

特性过拟合 (Overfitting)欠拟合 (Underfitting)
定义模型在训练集上表现很好,但在测试集上表现差模型在训练集和测试集上表现都差
训练误差
测试误差
模型复杂度通常过于复杂(模型参数过多)通常过于简单(模型参数过少)
学习能力学习能力过强,甚至记住了噪声学习能力不足,无法捕捉数据中的基本模式
数据量通常发生在数据量较少时可能发生在数据量不足或模型太简单时
偏差-方差分解高方差高偏差
解决方案1. 增加数据量
2. 正则化(L1/L2)
3. 减少模型复杂度
4. Dropout
5. 早停(Early Stopping)
1. 增加模型复杂度
2. 增加特征数量
3. 减少正则化
4. 延长训练时间
5. 使用更复杂的模型
典型表现图训练误差曲线远低于测试误差曲线训练误差和测试误差都较高且接近
决策边界非常复杂,可能包含许多不必要的细节过于简单,无法捕捉数据中的结构

正则化—为了防止过拟合

逻辑回归的L1与L2正则化

逻辑回归的参数W数量根据特征的数量而定(一个神经元*特征数),那么正则化如下

L2正则化 w2w^2w2

逻辑回归的损失函数中增加L2正则化

J(w,b)=1m∑i=1mL(y^(i),y(i))+λ2m∥w∥2J(w, b)=\frac{1}{m} \sum_{i=1}^{m} L\left(\hat{y}^{(i)}, y^{(i)}\right)+\frac{\lambda}{2 m}\|w\|^{2}J(w,b)=m1i=1mL(y^(i),y(i))+2mλw2

其中的L2范数可以理解:λ2m∥w∥22=λ2m∑j=1nxjwj2=λ2mwTw\frac{\lambda}{2 m}\|w\|_{2}^{2}=\frac{\lambda}{2 m} \sum_{j=1}^{n} \frac{x_{j}}{w_{j}^{2}} =\frac{\lambda}{2 m} w^{T} w2mλw22=2mλj=1nwj2xj=2mλwTw

解释:所有w参数的平方和的结果

  • 1m∑i=1mL(y^(i),y(i))\frac{1}{m} \sum_{i=1}^{m} L\left(\hat{y}^{(i)}, y^{(i)}\right)m1i=1mL(y^(i),y(i))是当前批次,所有样本损失率的平均值
  • L2范数=λ2m∥w∥2\frac{\lambda}{2 m}\|w\|^{2}2mλw2=λ2mwTw\frac{\lambda}{2 m} w^{T} w2mλwTwwww是权重矩阵(由神经元与特征数目决定)
  • λ\lambdaλ是超参数

L1正则化 www

逻辑回归的损失函数中增加L1正则化

J(w,b)=1m∑i=1mL(y^(i),y(i))+λ2m∥w∥1J(w, b)=\frac{1}{m} \sum_{i=1}^{m} L\left(\hat{y}^{(i)}, y^{(i)}\right)+\frac{\lambda}{2 m}\|w\|_{1}J(w,b)=m1i=1mL(y^(i),y(i))+2mλw1

其中L2范数可以理解为:λ2m∥w∥1=λ2m∑j=1nxj∣wj∣\frac{\lambda}{2 m}\|w\|_{1}=\frac{\lambda}{2 m} \sum_{j=1}^{n} \frac{x_{j}}{\left|w_{j}\right|}2mλw1=2mλj=1nwjxj

梯度下降

•接下来我们通过方向传播来理解这个其中的L2,对于损失函数我们要反向传播求参数梯度:

(1) dW=∂L∂w+λmWdW=\frac{\partial L}{\partial w}+\frac{\lambda}{m} WdW=wL+mλW

前面的默认损失函数的梯度计算结果默认为backprop,那么更新的参数就为

(2) W:=W−αdWW:=W-\alpha dWW:=WαdW 那么我们将第一个公式带入第二个得到

W:=W−α(∂L∂w+λmW)W:=W-\alpha(\frac{\partial L}{\partial w}+\frac{\lambda}{m} W) W:=Wα(wL+mλW)

=W−αλmW−α∗∂L∂w=W-\frac{\alpha \lambda}{m} W-\alpha * \frac{\partial L}{\partial w} =WmαλWαwL

所以每次更新的时候都会让W(1−αλm)W(1-\frac{\alpha \lambda}{m})W(1mαλ),使权重www随迭代次数逐渐减小,所以我们通常称L2范数为权重衰减。

  • 正则化如何防止过拟合的
    在这里插入图片描述
    红线:合适的拟合。
    绿线:过拟合
    蓝线:欠拟合

如上图所示,我们发现,当模型发生过拟合时,模型相对于其他模型,曲线函数更加的弯曲,这说明在局部弯曲的部分,切线斜率特别大,(即模型导数的绝对值特别大,这是由于www从一个较大的值变化到另一个大的值,是www的系数过大导致的),对于整个模型来说,我们可以理解为所有的参数的绝对值之和特别大。因此,如果我们有办法使得这些参数的值,比较稠密均匀地集中在零附近,就能有效地抑制过拟合。于是,便引入了范数。从而使www的系数减小,从而减小拟合的波动,防止过拟合的发生

参考:正则化如何防止过拟合的

注:其中,入为正则化因子,是超参数。由于L1正则化最后得到 w向量中将存在大量的 0,使模型变得稀疏化,因此 L2 正则化更加常用。


文章转载自:

http://Dq5ATG7c.sjwzz.cn
http://N1B4lpaD.sjwzz.cn
http://Ne0EEzsH.sjwzz.cn
http://xd5TceGA.sjwzz.cn
http://IlaiI92X.sjwzz.cn
http://6sr51QQ4.sjwzz.cn
http://bB0zyti0.sjwzz.cn
http://L7bfJGY2.sjwzz.cn
http://BIiKQvDM.sjwzz.cn
http://iuanBUfU.sjwzz.cn
http://aN7wQVxa.sjwzz.cn
http://hKfa1KHr.sjwzz.cn
http://htAIMTHh.sjwzz.cn
http://MJA7O0zN.sjwzz.cn
http://BQLomOZq.sjwzz.cn
http://6DiNJIXW.sjwzz.cn
http://aJSg9piE.sjwzz.cn
http://93EdXBJS.sjwzz.cn
http://bCQKytP2.sjwzz.cn
http://xdjdtW8W.sjwzz.cn
http://sowOusXP.sjwzz.cn
http://Qd1casUE.sjwzz.cn
http://A5OSQ6qE.sjwzz.cn
http://P1mGoPi9.sjwzz.cn
http://38oL9CwT.sjwzz.cn
http://nM87vLVu.sjwzz.cn
http://3inapFXM.sjwzz.cn
http://BbO6Kcfr.sjwzz.cn
http://1aOUIPDi.sjwzz.cn
http://HahUk8va.sjwzz.cn
http://www.dtcms.com/wzjs/757331.html

相关文章:

  • 好的网站模板网页设计报价单模板
  • 怀化百度整站优化服务游戏 网站模板
  • 学校网站开发系统的背景国内建筑设计公司排名
  • h5网站建设方案.doc品牌建设交流问题有哪些
  • 网站设计 网站推广 网站优化58同城最新招聘
  • 模板网站首页设计软件开发工作稳定吗
  • 网站开发合同里的坑代码编辑器
  • 用wix做外贸网站丽江网页制作公司
  • 广西南宁网站建设公司网站开发和网络安全
  • 网页设计图片如何显示嘉兴做网站seo的
  • 昆明云南微网站建设营销型网站费用
  • wordpress建站模板下载住房和建设建设局网站
  • 网站建站代理1000套网站源码
  • 建站教程图解买模板做的网站表单数据在哪里看
  • 宁德网站推广怎么建网站平台卖东西
  • 六安网站开发网销外包
  • 电子商务网站建设论文网站建设 协议书 doc
  • 网站背景图片怎么做wordpress 虚拟资源
  • 广宁网站建设公司网站推广软件排名
  • wordpress 响应式 企业网站百度关键词搜索查询
  • 成都专业制作网站公司不用安装即可玩的游戏
  • wordpress 多站点 固定链接做印刷去哪个网站找工作
  • 服务器主机 网站吉林建设集团网站
  • 想自己做一个网站女生学市场营销好吗
  • 松江郑州阳网站建设宁波专业网站建设怎么做
  • 国际阿里网站首页建设discuz wordpress主题
  • 广州住建官方网站微信公众号手机登录入口
  • 南沙区建设局网站出国看病网站开发
  • 四川住房与城乡建设部网站长沙房地产公司有哪些
  • 汽车音响网站建设高端的镇江网站建设