当前位置: 首页 > news >正文

机器学习(8)梯度下降的实现与过拟合问题

一、梯度下降的实现(Gradient Descent Implementation)

        在训练模型时,我们的目标是最小化代价函数(Cost Function)
        梯度下降是一种常用的优化算法,通过不断调整参数 w,b,让代价函数 J(w,b) 逐渐逼近最小值。

1. 算法思想

梯度下降算法的核心思想是:

从某一点出发,沿着函数下降最快的方向(即负梯度方向)前进,直到到达最小值。

更新规则为:

其中:

  • α 为 学习率(Learning Rate)

  • 梯度(Gradient)

2. 线性回归与逻辑回归中的区别

        虽然线性回归与逻辑回归都使用梯度下降算法,但它们的代价函数与导数不同:

模型预测函数代价函数特点
线性回归使用平方误差,函数为凸函数
逻辑回归使用对数损失,函数为凸函数

        二者的梯度下降形式一致,但梯度计算方式不同。


二、过拟合的问题(Overfitting Problem)

1. 概念

        过拟合(Overfitting) 是指模型在训练数据上表现很好,但在测试数据上表现很差。即模型“记住”了训练数据的特征,而没有学会通用的规律。

2. 举例说明

        假设我们要使用线性模型预测房价。

面积(x)房价(y)
50100
60120
70140
80160
90180
  • 使用线性回归模型(一次多项式):

    → 模型可能欠拟合(Underfitting),无法捕捉复杂变化。

  • 使用二次多项式模型

    → 更好地拟合数据,误差降低。

  • 使用四次多项式模型

    → 几乎完美地通过每个点(训练误差为0),但在新样本上波动剧烈,泛化能力极差。

这就是典型的过拟合现象

同样地,过拟合问题也会出现在分类任务中。例如:

  • 模型在训练集上能精确分类每个点;

  • 但在测试集上预测错误率非常高。


三、解决过拟合的方法(How to Reduce Overfitting)

方法一:增加训练数据

        获取更多样化的训练数据,能帮助模型学习到更真实的分布,减少过度拟合噪声的风险。

方法二:减少特征数量

  • 移除不相关或冗余特征;

  • 避免使用过高阶多项式;

  • 选择有代表性的关键特征。

这相当于“让模型变简单”,降低复杂度。

方法三:正则化(Regularization)

        正则化是一种通过约束参数大小来防止过拟合的方法。我们不直接删除特征,而是让参数的值尽量小。

1. 正则化思想

在代价函数中加入一个“惩罚项”,鼓励参数 wiw_iwi​ 变小。

其中:

  • λ 是正则化参数(Regularization Parameter)

  • 惩罚项 防止权重过大

2. 正则化更新规则(线性回归)

方法四:特征选择(Feature Selection)

        有些情况下,我们可以直接去除权重较小或不重要的特征(相当于让参数为0),进一步简化模型。


 总结

过拟合原因解决思路
模型太复杂减少特征数量、使用正则化
数据太少增加训练样本
参数太多使用较小的多项式或正则化项
学习噪声数据清洗、平滑处理
http://www.dtcms.com/a/521831.html

相关文章:

  • h5游戏免费下载:维京战争
  • 门户网站建设投标书小程序软件定制开发
  • 外贸网站建设价格外贸网站推广公司最大
  • 【北京迅为】iTOP-4412精英版使用手册-第六十五章 Linux-定时器
  • 网页设计网站怎么做网站制作文案
  • rocky 9.5系统安装zabbix监控实现邮件告警
  • 梅河口网站建设张艺兴粉丝做的网站
  • 做杂志的网站有哪些哪个页面设计培训好
  • 国际贸易网站有哪些电影网站的建设目标
  • cuda13.0 torch2.9 python3.12 安装flash-attn window版的哪里有
  • 外贸公司网站制作公司网站的字体颜色
  • 免费源代码网站瑞安做网站
  • 专门做礼物的网站广州红盾信息门户网站
  • 单片机的开发——无人机篇(未完待续,有时间写)
  • 做网店哪个网站好中小互联网企业有哪些
  • 广州学建设网站啥都能看的浏览器
  • 丰浩网站建设中心软件开发合同范本免费
  • wordpress咋建站附近卖建筑模板市场
  • 性男女做视频观看网站响应式网站手机端尺寸
  • SpringBoot-Web开发之数据响应
  • 珠海专业网站建设费用360建筑官网
  • Linux 中的 DNS 工作原理(一):​​从 getaddrinfo 到 resolv.conf
  • 自己编程做网站骆诗网站建设
  • 在哪查找网站的建设者中文网站建设
  • python asyncio的各种用法与代码示例
  • 深圳网站营销型建设免费网络电话呼叫系统
  • Linux-基础IO(1)
  • 如何上传网站网站开发价格明细
  • 深圳英文网站制作定西建设厅网站
  • 面向边缘AI视觉系统的低成本硬件方案