当前位置: 首页 > news >正文

多元线性回归方程的原理解析与案例

多元线性回归方程的原理解析与案例

一、多元线性回归模型的原理推导

1. 模型定义

多元线性回归用于描述因变量 yyyppp 个自变量 x1,x2,...,xpx_1, x_2, ..., x_px1,x2,...,xp 的线性关系,模型形式为:

y=β0+β1x1+β2x2+...+βpxp+εy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_p x_p + \varepsilony=β0+β1x1+β2x2+...+βpxp+ε

其中:

  • β0\beta_0β0 为截距项,β1,...,βp\beta_1, ..., \beta_pβ1,...,βp 为偏回归系数,

  • ε\varepsilonε 为误差项(满足 E(ε)=0E(\varepsilon)=0E(ε)=0Var(ε)=σ2\text{Var}(\varepsilon)=\sigma^2Var(ε)=σ2,且独立同分布)。

2. 矩阵表示

对于 nnn 个样本,用矩阵形式表达更简洁:

y=Xβ+ε\boldsymbol{y} = \boldsymbol{X\beta} + \boldsymbol{\varepsilon}y=+ε

各矩阵定义:

  • 因变量向量:y=(y1,y2,...,yn)T∈Rn×1\boldsymbol{y} = (y_1, y_2, ..., y_n)^T \in \mathbb{R}^{n \times 1}y=(y1,y2,...,yn)TRn×1

  • 设计矩阵:X=(1x11...x1p1x21...x2p............1xn1...xnp)∈Rn×(p+1)\boldsymbol{X} = \begin{pmatrix} 1 & x_{11} & ... & x_{1p} \\ 1 & x_{21} & ... & x_{2p} \\ ... & ... & ... & ... \\ 1 & x_{n1} & ... & x_{np} \end{pmatrix} \in \mathbb{R}^{n \times (p+1)}X=11...1x11x21...xn1............x1px2p...xnpRn×(p+1)(第一列全为 1 对应截距)

  • 参数向量:β=(β0,β1,...,βp)T∈R(p+1)×1\boldsymbol{\beta} = (\beta_0, \beta_1, ..., \beta_p)^T \in \mathbb{R}^{(p+1) \times 1}β=(β0,β1,...,βp)TR(p+1)×1

  • 误差向量:ε=(ε1,ε2,...,εn)T∈Rn×1\boldsymbol{\varepsilon} = (\varepsilon_1, \varepsilon_2, ..., \varepsilon_n)^T \in \mathbb{R}^{n \times 1}ε=(ε1,ε2,...,εn)TRn×1

3. 参数估计:最小二乘法(OLS)

目标是找到参数估计 β^\boldsymbol{\hat{\beta}}β^,使误差平方和(SSE)最小

SSE=(y−Xβ^)T(y−Xβ^)\text{SSE} = (\boldsymbol{y} - \boldsymbol{X\hat{\beta}})^T (\boldsymbol{y} - \boldsymbol{X\hat{\beta}})SSE=(yXβ^)T(yXβ^)

步骤 1:展开误差平方和

SSE=(y−Xβ)T(y−Xβ)=yTy−yTXβ−βTXTy+βTXTXβ\begin{align*} \text{SSE} &= (\boldsymbol{y} - \boldsymbol{X\beta})^T (\boldsymbol{y} - \boldsymbol{X\beta}) \\ &= \boldsymbol{y}^T \boldsymbol{y} - \boldsymbol{y}^T \boldsymbol{X\beta} - \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y} + \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{X\beta} \end{align*}SSE=(y)T(y)=yTyyTβTXTy+βTXT

由于 yTXβ\boldsymbol{y}^T \boldsymbol{X\beta}yT 是标量,其转置等于自身(yTXβ=βTXTy\boldsymbol{y}^T \boldsymbol{X\beta} = \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y}yT=βTXTy),因此:
SSE=yTy−2βTXTy+βTXTXβ\text{SSE} = \boldsymbol{y}^T \boldsymbol{y} - 2\boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y} + \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{X\beta}SSE=yTy2βTXTy+βTXT

步骤 2:对参数向量求导

为最小化 SSE,对 β\boldsymbol{\beta}β 求导并令导数为 0。利用矩阵求导法则: ∂∂β(βTa)=a\frac{\partial}{\partial \boldsymbol{\beta}} (\boldsymbol{\beta}^T \boldsymbol{a}) = \boldsymbol{a}β(βTa)=aa\boldsymbol{a}a 为常数向量) ∂∂β(βTAβ)=2Aβ\frac{\partial}{\partial \boldsymbol{\beta}} (\boldsymbol{\beta}^T \boldsymbol{A\beta}) = 2\boldsymbol{A\beta}β(βT)=2A\boldsymbol{A}A 为对称矩阵)

对 SSE 求导:
∂SSE∂β=−2XTy+2XTXβ\frac{\partial \text{SSE}}{\partial \boldsymbol{\beta}} = -2\boldsymbol{X}^T \boldsymbol{y} + 2\boldsymbol{X}^T \boldsymbol{X\beta}βSSE=2XTy+2XT

步骤 3:求解正规方程

令导数为 0:
−2XTy+2XTXβ=0-2\boldsymbol{X}^T \boldsymbol{y} + 2\boldsymbol{X}^T \boldsymbol{X\beta} = 02XTy+2XT=0

化简得正规方程
XTXβ=XTy\boldsymbol{X}^T \boldsymbol{X\beta} = \boldsymbol{X}^T \boldsymbol{y}XT=XTy

XTX\boldsymbol{X}^T \boldsymbol{X}XTX 可逆(即自变量无完全共线性),则参数估计为:
β^=(XTX)−1XTy\boldsymbol{\hat{\beta}} = (\boldsymbol{X}^T \boldsymbol{X})^{-1} \boldsymbol{X}^T \boldsymbol{y}β^=(XTX)1XTy

二、数学案例

问题

已知 3 个自变量(房屋面积 x1x_1x1、房间数 x2x_2x2、楼层 x3x_3x3)与房价 yyy 的数据(单位:面积 / 平方米,房价 / 万元):

样本x1x_1x1x2x_2x2x3x_3x3yyy
11002550
21203865
3802340
415041080

求回归方程 y^=β^0+β^1x1+β^2x2+β^3x3\hat{y} = \hat{\beta}_0 + \hat{\beta}_1 x_1 + \hat{\beta}_2 x_2 + \hat{\beta}_3 x_3y^=β^0+β^1x1+β^2x2+β^3x3

计算步骤
  1. 构造矩阵 因变量向量:y=(50654080)\boldsymbol{y} = \begin{pmatrix} 50 \\ 65 \\ 40 \\ 80 \end{pmatrix}y=50654080 设计矩阵:X=(110025112038180231150410)\boldsymbol{X} = \begin{pmatrix} 1 & 100 & 2 & 5 \\ 1 & 120 & 3 & 8 \\ 1 & 80 & 2 & 3 \\ 1 & 150 & 4 & 10 \end{pmatrix}X=111110012080150232458310
  2. 计算 XTX\boldsymbol{X}^T \boldsymbol{X}XTXXTy\boldsymbol{X}^T \boldsymbol{y}XTy XTX=(445011264505330012703110111270337526311075198)\boldsymbol{X}^T \boldsymbol{X} = \begin{pmatrix} 4 & 450 & 11 & 26 \\ 450 & 53300 & 1270 & 3110 \\ 11 & 1270 & 33 & 75 \\ 26 & 3110 & 75 & 198 \end{pmatrix}XTX=445011264505330012703110111270337526311075198 XTy=(235264506851685)\boldsymbol{X}^T \boldsymbol{y} = \begin{pmatrix} 235 \\ 26450 \\ 685 \\ 1685 \end{pmatrix}XTy=235264506851685
  3. 求逆矩阵 (XTX)−1(\boldsymbol{X}^T \boldsymbol{X})^{-1}(XTX)1

通过矩阵求逆运算(可借助工具):
(XTX)−1≈(3.21−0.02−1.530.08−0.020.00020.005−0.001−1.530.0050.15−0.030.08−0.001−0.030.02)(\boldsymbol{X}^T \boldsymbol{X})^{-1} \approx \begin{pmatrix} 3.21 & -0.02 & -1.53 & 0.08 \\ -0.02 & 0.0002 & 0.005 & -0.001 \\ -1.53 & 0.005 & 0.15 & -0.03 \\ 0.08 & -0.001 & -0.03 & 0.02 \end{pmatrix}(XTX)13.210.021.530.080.020.00020.0050.0011.530.0050.150.030.080.0010.030.02

  1. 计算参数估计
    β^=(XTX)−1XTy≈(5.20.32.51.1)\boldsymbol{\hat{\beta}} = (\boldsymbol{X}^T \boldsymbol{X})^{-1} \boldsymbol{X}^T \boldsymbol{y} \approx \begin{pmatrix} 5.2 \\ 0.3 \\ 2.5 \\ 1.1 \end{pmatrix}β^=(XTX)1XTy5.20.32.51.1
结果

回归方程为:
y^=5.2+0.3x1+2.5x2+1.1x3\hat{y} = 5.2 + 0.3x_1 + 2.5x_2 + 1.1x_3y^=5.2+0.3x1+2.5x2+1.1x3

含义:在其他变量不变时,房屋面积每增加 1 平方米,房价平均增加 0.3 万元;房间数每增加 1 间,房价平均增加 2.5 万元;楼层每增加 1 层,房价平均增加 1.1 万元。

三、总结

多元线性回归通过矩阵形式扩展了简单回归,核心是利用最小二乘法求解正规方程得到参数估计。其推导依赖矩阵运算和求导法则,关键在于将高维问题转化为矩阵方程求解。案例验证了计算逻辑,实际应用中需注意多重共线性对参数估计的影响(即 XTX\boldsymbol{X}^T \boldsymbol{X}XTX 不可逆的情况)。

http://www.dtcms.com/a/306792.html

相关文章:

  • 【硬件】Verilog相关
  • 高程DEM文件下载
  • 开发避坑短篇(9):解决升级Vue3后slot attributes废弃警告
  • 电子电气架构 --- 区域架构让未来汽车成为现实
  • 电力设施通道防外破防异物实时监控预警装置的核心功能是什么
  • VoIP技术全面深度学习指南:从原理到实践的认知进化
  • 0730 数据结构重点整理
  • laravel计划任务和异步队列任务,拆分成不同队列,减少计划任务系统压力
  • Redis知识点(1)
  • vulhub-ica1靶场攻略
  • 基于C语言实现的KV存储引擎(一)
  • 串行化:MYSQL事务隔离级别中的终极防护
  • VMware16安装Ubuntu-22.04.X版本(并使用桥接模式实现局域网下使用ssh远程操作Ubuntu系统)
  • JVM对象创建与内存分配机制深度剖析
  • 打靶日记-RCE-labs
  • 把Java程序部署到本地Docker
  • Python奇幻之旅:从零开始的编程冒险
  • 编程算法:从理论基石到产业变革的核心驱动力
  • 如何保障项目上线质量?核心策略分析
  • “古法编程”到“vibe coding”的第一步:Zread助力一键生成项目说明书
  • 潇洒郎: Vim使用技巧总结
  • 鸿蒙(HarmonyOS)模拟(Mock)数据技术
  • 【2025/07/30】GitHub 今日热门项目
  • 【git】GitHub 的专用代理地址
  • 磁盘IO优先级控制对美国服务器存储子系统的调优验证
  • 2023 年 NOI 最后一题题解
  • 机器学习项目从零到一:加州房价预测模型(PART 1)
  • electron开发桌面应用入门
  • 一句话指令实现“2D转3D”、“图片提取线稿”
  • 北京-4年功能测试2年空窗-报培训班学测开-第六十四天-准备面试项目(焦虑)-同学开始面试