当前位置: 首页 > news >正文

线性回归——相关数学概念详解

1、前言定义

yiy_iyi 代表第i个真实值
yˉ\bar{y}yˉ 代表真实值的平均值
yi^\hat{y_i}yi^ 代表第i个预测值

2、总平方和(Total Sum of Squares, SST)

总平方和(Total Sum of Squares, SST): 这是最“朴素”的模型的误差。这个朴素模型不考虑任何特征,直接用目标变量的平均值 yˉ\bar{y}yˉ 作为所有样本的预测值。SST 衡量了目标变量自身整体的波动程度。
SST=∑i=1n(yi−yˉ)2{SST} = \sum_{i=1}^{n}(y_i - \bar{y})^2SST=i=1n(yiyˉ)2

3、残差平方和(Residual Sum of Squares, SSR 或 RSS)

残差平方和(Residual Sum of Squares, SSR 或 RSS): 这是我们线性回归模型的误差。它是每个样本的真实值 yiy_iyi 与模型预测值 yi^\hat{y_i}yi^ 之差的平方和。SSR 衡量了模型未能解释的波动部分。
SSR=∑i=1n(yi−yi^)2{SSR} = \sum_{i=1}^{n}(y_i - \hat{y_i})^2SSR=i=1n(yiyi^)2

yi^\hat{y_i}yi^ -yˉ\bar{y}yˉ )代表残差

4、解释平方和(Explained Sum of Squares, SSE)

解释平方和(Explained Sum of Squares, SSE): 这是模型解释的波动部分,即预测值 yi^\hat{y_i}yi^ 与平均值 yˉ\bar{y}yˉ 之差的平方和。
SSE=∑i=1n(yi^−yˉ)2{SSE} = \sum_{i=1}^{n}(\hat{y_i} - \bar{y})^2SSE=i=1n(yi^yˉ)2

5、​MSE(均方误差,Mean Squared Error)​

对残差平方和求取平均值就是均方误差,即可用于训练集也可以用于测试集,公式如下:

MSE=1m∑i=1m(yi−y^i)2MSE = \frac{1}{m}\sum_{i=1}^{m}(y_i - \hat{y}_i)^2MSE=m1i=1m(yiy^i)2

  • MSE用于训练集
    用于训练集,此时模型的权重集还未知,要找到一组参数 (β0,β1,...,βn)(\beta_0, \beta_1, ..., \beta_n)(β0,β1,...,βn),使得 MSE 损失函数的值最小,来得到一个模型。
    得到模型之后再对训练集的预测值和真实值做MSE计算,一定是最小的
  • MSE用于测试集
    用于测试集,此时模型已经求解完成,可以获取测试集对应的预测值和准确值,进而求取测试集的均方误差。MSE用于测试集主要是用来判断模型的好坏,MSE越小,代表模型越好

6、决定系数(R-squared) R² ​

R2=1−(SSR/SST)R² = 1 - (SSR / SST)R2=1(SSR/SST)
R² ​既可以用作训练集,也可以用作测试集,

  • R² ​用作训练集
    R² ​用作训练集无意义,因为对于训练集SST是一个常数,而SSR本身就是用训练集的数据求取出来的最小值,所以R² ​用作训练集无意义
  • R² ​用作测试集
    R²用作测试集,是用于评估回归模型性能的一个核心指标。
    它的核心思想是​:与一个最简单的“基线模型”相比,我们的回归模型将误差降低了多少比例。
    ​这个“基线模型”是什么?​​ 它是一个非常“笨”的模型,它永远用目标变量 y的平均值 y_mean来作为预测值,不考虑任何特征。
    ​R² 的含义​: 我们的模型通过引入特征,将预测误差降低到了基线模型误差的百分之多少。
    因此,R² 衡量的是模型对目标变量波动的解释能力。

R² 的取值范围看起来是 (-∞, 1],但通常我们这样解读:

R² 值解释
R² = 1完美模型。 模型完美拟合了所有数据点,残差为0(SSR=0)。这在实际中几乎不可能出现,如果出现,很可能是数据泄露或过拟合。
R² 接近 1模型优秀。 例如 R²=0.9,意味着模型解释了目标变量90%的方差。说明模型拟合效果好。
R² > 0模型优于基线模型。 即使 R²=0.3,也意味着你的模型比简单地使用平均值来预测要好,它解释了30%的方差。
R² = 0模型等同于基线模型。 你的模型的预测效果和直接猜测 y_mean 一样差。说明特征可能完全没有提供有用的信息。
R² < 0模型比基线模型还差。 这是一个警告信号!意味着你的模型拟合得极其糟糕,甚至不如直接使用平均值来预测。

重要提示: R² 为负通常发生在两种情况下:

  1. 你在测试集上评估模型,但模型在测试集上的表现非常差(模型没有泛化能力)。
  2. 你没有使用带截距项的线性回归模型(例如设置了 fit_intercept=False),而数据本身并不通过原点。此时,比较的基线就不再是 y_mean,计算逻辑会出问题。
http://www.dtcms.com/a/551035.html

相关文章:

  • 专业企业网站设计服务公司商城网站数据库
  • 微网站如何建设方案saas系统销售好做吗
  • 设计网站物理结构怎么做洛阳做网站找哪家
  • 如何保护网站模板时代创信网站建设
  • 学习网站开发流程大型网站建设机构
  • https证书
  • 学习pytorch的第二日
  • 网站五合一建设湖北联诺建设网站
  • 做网站的编程语言免费crm软件
  • 关键词首页排名优化公司推荐seo排名工具有哪些
  • c 做网站简单吗网站建设艾金手指六六12
  • 【4】深度解析“协议(Protocol)”与“服务(Sevices)
  • 3. vim上手
  • 常德网站建设求职简历做视频怎么去除网站
  • 网站域名301规模以上工业企业名单
  • 手机网站和电脑网站跳转上城区商城网站建设
  • 论坛网站开发深圳国外网站设计
  • 做网站主色调选择网站需求列表
  • 专业网站建设的公司排名wordpress 文章 同步
  • 开发网站私活wordpress 主页添加来源
  • 地方战友网站建设网站建设设计书任务书
  • 建设官网站片多多可以免费看电视剧吗
  • 我要用新浪云做网站站群cms系统
  • discuz论坛网站做的门户私人衣橱网站建设
  • 济南网站建设抖音平台源码超市网站源码
  • 做公益网站的原因人才网最新招聘信息2023年
  • 玉溪网络推广 网站建设wordpress安装出现乱码
  • 外贸网站建设维护关于公司网站建设情况的汇报
  • 网站背景磨砂灰背景怎么做做名片上什么网站
  • 营销外包团队网站标签优化