当前位置：首页 > news >正文

残差：从统计学到深度学习的核心概念

news 2025/9/14 8:04:53

本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！

1 什么是残差？

残差（Residual）是统计学和机器学习中的重要概念，指观测值与模型预测值之间的差异。其基本计算公式为：

$ei=yi−y^ie_i = y_i - \hat{y}_i$

其中：

$y_i$ 是实际观测值 📊
$y^i\hat{y}_i$ 是模型预测值 🔮

举个简单例子：在房价预测模型中，如果某房屋实际售价为100万元，模型预测为95万元，则残差为+5万元（表示模型低估了实际价格）。

残差反映了模型预测的误差大小和方向，是评估模型性能、诊断模型问题的重要指标。正残差表示模型低估了实际值，负残差则表示模型高估了实际值。

本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！

往期文章推荐:

20.大语言模型强化学习中的熵崩溃现象：机制、影响与解决方案
19.线性预热机制（Linear Warmup）：深度学习训练稳定性的关键策略
18.蚁群算法详解：从蚂蚁觅食到优化利器
17.粒子群优化（PSO）算法详解：从鸟群行为到强大优化工具
16.NSGA-II多目标优化算法：原理、应用与实现
15.SPEA2多目标进化算法：理论与应用全解析
14.NSGA系列多目标优化算法：从理论到实践
13.Adam优化算法：深度学习的自适应动量估计方法
12.VeRL：强化学习与大模型训练的高效融合框架
11.BBEH：大模型高阶推理能力的“超难”试金石
10.MGSM：大模型多语言数学推理的“试金石”
9.灾难性遗忘：神经网络持续学习的核心挑战与解决方案
8.内存墙：计算性能的隐形枷锁与突破之路
7.阿喀琉斯之踵：从神话传说到现代隐喻的致命弱点
6.DS-1000：数据科学代码生成的可靠基准测试
5.MultiPL-E: 多语言代码生成的革命性基准测试框架
4.梯度爆炸问题：深度学习中的「链式核弹」与拆弹指南
3.IBM穿孔卡片：现代计算技术的奠基之作
2.EDVAC：现代计算机体系的奠基之作
1.机电装置：从基础原理到前沿应用的全方位解析

2 残差的核心作用

2.1 模型诊断 🤖

通过分析残差分布（如绘制残差图），可以检验模型假设是否成立（如线性、方差齐性）。如果残差呈现规律性分布（如曲线模式），可能意味着需要引入非线性项或改变模型形式。

2.2 异常值检测 🎯

标准化残差（残差除以其标准差）或学生化残差（考虑数据点对模型的影响）可以帮助识别异常值。异常值可能对模型产生不成比例的影响，识别并处理这些值是提高模型准确性的关键。

2.3 模型优化 ⚙️

残差分析能够为模型改进提供方向，例如发现残差在某些特定区间内呈现非随机性时，可能需要引入新的变量或考虑交互作用。

3 残差的相关概念

3.1 残差平方和（RSS）

残差平方和（Residual Sum of Squares, RSS）是所有残差的平方和，用于评估模型整体拟合效果，公式为：

$RSS=∑i=1nei2\text{RSS} = \sum_{i=1}^n e_i^2$

最小二乘法就是通过最小化RSS来求解模型参数的。

3.2 随机误差 vs. 残差

需要注意的是，随机误差和残差是两个相关但不同的概念：

随机误差：是模型中将未知因素对因变量的影响，是理论上的概念，不可直接观测。
残差：是实际观测值与模型预测值的差额，可以根据样本数据计算得出。

实践中，人们常用残差来估计随机误差项。

以下是残差与随机误差的对比表：

特征	随机误差	残差
定义	总体模型中的不可观测误差	样本中观测值与预测值的差异
性质	理论概念，不可直接测量	实际计算值，可直接测量
作用	反映未知因素对因变量的影响	评估模型拟合质量，诊断模型问题
可观测性	不可直接观测	可直接计算
与模型关系	存在于总体回归模型中	存在于样本回归模型中

3.3 正态性假设

经典线性回归假设残差服从正态分布，以保证统计推断（如t检验、置信区间）的有效性。实践中可以通过Q-Q图或统计检验（如Shapiro-Wilk检验）来验证这一假设。

4 残差在深度学习中的应用：ResNet革命

4.1 ResNet的诞生

虽然残差的概念早已存在于统计学中，但它在深度学习领域的革命性应用体现在残差网络（Residual Network, ResNet）中。ResNet由Kaiming He等人于2015年提出，其核心论文《Deep Residual Learning for Image Recognition》已成为计算机视觉领域的里程碑之作。

原始论文出处：
He, K., Zhang, X., Ren, S., & Sun, J. (2015). Deep Residual Learning for Image Recognition. 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 770-778. https://arxiv.org/abs/1512.03385