多元线性回归方程的原理解析与案例
多元线性回归方程的原理解析与案例
一、多元线性回归模型的原理推导
1. 模型定义
多元线性回归用于描述因变量 yyy 与 ppp 个自变量 x1,x2,...,xpx_1, x_2, ..., x_px1,x2,...,xp 的线性关系,模型形式为:
y=β0+β1x1+β2x2+...+βpxp+εy = \beta_0 + \beta_1 x_1 + \beta_2 x_2 + ... + \beta_p x_p + \varepsilony=β0+β1x1+β2x2+...+βpxp+ε
其中:
-
β0\beta_0β0 为截距项,β1,...,βp\beta_1, ..., \beta_pβ1,...,βp 为偏回归系数,
-
ε\varepsilonε 为误差项(满足 E(ε)=0E(\varepsilon)=0E(ε)=0,Var(ε)=σ2\text{Var}(\varepsilon)=\sigma^2Var(ε)=σ2,且独立同分布)。
2. 矩阵表示
对于 nnn 个样本,用矩阵形式表达更简洁:
y=Xβ+ε\boldsymbol{y} = \boldsymbol{X\beta} + \boldsymbol{\varepsilon}y=Xβ+ε
各矩阵定义:
-
因变量向量:y=(y1,y2,...,yn)T∈Rn×1\boldsymbol{y} = (y_1, y_2, ..., y_n)^T \in \mathbb{R}^{n \times 1}y=(y1,y2,...,yn)T∈Rn×1
-
设计矩阵:X=(1x11...x1p1x21...x2p............1xn1...xnp)∈Rn×(p+1)\boldsymbol{X} = \begin{pmatrix} 1 & x_{11} & ... & x_{1p} \\ 1 & x_{21} & ... & x_{2p} \\ ... & ... & ... & ... \\ 1 & x_{n1} & ... & x_{np} \end{pmatrix} \in \mathbb{R}^{n \times (p+1)}X=11...1x11x21...xn1............x1px2p...xnp∈Rn×(p+1)(第一列全为 1 对应截距)
-
参数向量:β=(β0,β1,...,βp)T∈R(p+1)×1\boldsymbol{\beta} = (\beta_0, \beta_1, ..., \beta_p)^T \in \mathbb{R}^{(p+1) \times 1}β=(β0,β1,...,βp)T∈R(p+1)×1
-
误差向量:ε=(ε1,ε2,...,εn)T∈Rn×1\boldsymbol{\varepsilon} = (\varepsilon_1, \varepsilon_2, ..., \varepsilon_n)^T \in \mathbb{R}^{n \times 1}ε=(ε1,ε2,...,εn)T∈Rn×1
3. 参数估计:最小二乘法(OLS)
目标是找到参数估计 β^\boldsymbol{\hat{\beta}}β^,使误差平方和(SSE)最小:
SSE=(y−Xβ^)T(y−Xβ^)\text{SSE} = (\boldsymbol{y} - \boldsymbol{X\hat{\beta}})^T (\boldsymbol{y} - \boldsymbol{X\hat{\beta}})SSE=(y−Xβ^)T(y−Xβ^)
步骤 1:展开误差平方和
SSE=(y−Xβ)T(y−Xβ)=yTy−yTXβ−βTXTy+βTXTXβ\begin{align*} \text{SSE} &= (\boldsymbol{y} - \boldsymbol{X\beta})^T (\boldsymbol{y} - \boldsymbol{X\beta}) \\ &= \boldsymbol{y}^T \boldsymbol{y} - \boldsymbol{y}^T \boldsymbol{X\beta} - \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y} + \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{X\beta} \end{align*}SSE=(y−Xβ)T(y−Xβ)=yTy−yTXβ−βTXTy+βTXTXβ
由于 yTXβ\boldsymbol{y}^T \boldsymbol{X\beta}yTXβ 是标量,其转置等于自身(yTXβ=βTXTy\boldsymbol{y}^T \boldsymbol{X\beta} = \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y}yTXβ=βTXTy),因此:
SSE=yTy−2βTXTy+βTXTXβ\text{SSE} = \boldsymbol{y}^T \boldsymbol{y} - 2\boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{y} + \boldsymbol{\beta}^T \boldsymbol{X}^T \boldsymbol{X\beta}SSE=yTy−2βTXTy+βTXTXβ
步骤 2:对参数向量求导
为最小化 SSE,对 β\boldsymbol{\beta}β 求导并令导数为 0。利用矩阵求导法则: ∂∂β(βTa)=a\frac{\partial}{\partial \boldsymbol{\beta}} (\boldsymbol{\beta}^T \boldsymbol{a}) = \boldsymbol{a}∂β∂(βTa)=a(a\boldsymbol{a}a 为常数向量) ∂∂β(βTAβ)=2Aβ\frac{\partial}{\partial \boldsymbol{\beta}} (\boldsymbol{\beta}^T \boldsymbol{A\beta}) = 2\boldsymbol{A\beta}∂β∂(βTAβ)=2Aβ(A\boldsymbol{A}A 为对称矩阵)
对 SSE 求导:
∂SSE∂β=−2XTy+2XTXβ\frac{\partial \text{SSE}}{\partial \boldsymbol{\beta}} = -2\boldsymbol{X}^T \boldsymbol{y} + 2\boldsymbol{X}^T \boldsymbol{X\beta}∂β∂SSE=−2XTy+2XTXβ
步骤 3:求解正规方程
令导数为 0:
−2XTy+2XTXβ=0-2\boldsymbol{X}^T \boldsymbol{y} + 2\boldsymbol{X}^T \boldsymbol{X\beta} = 0−2XTy+2XTXβ=0
化简得正规方程:
XTXβ=XTy\boldsymbol{X}^T \boldsymbol{X\beta} = \boldsymbol{X}^T \boldsymbol{y}XTXβ=XTy
若 XTX\boldsymbol{X}^T \boldsymbol{X}XTX 可逆(即自变量无完全共线性),则参数估计为:
β^=(XTX)−1XTy\boldsymbol{\hat{\beta}} = (\boldsymbol{X}^T \boldsymbol{X})^{-1} \boldsymbol{X}^T \boldsymbol{y}β^=(XTX)−1XTy
二、数学案例
问题
已知 3 个自变量(房屋面积 x1x_1x1、房间数 x2x_2x2、楼层 x3x_3x3)与房价 yyy 的数据(单位:面积 / 平方米,房价 / 万元):
样本 | x1x_1x1 | x2x_2x2 | x3x_3x3 | yyy |
---|---|---|---|---|
1 | 100 | 2 | 5 | 50 |
2 | 120 | 3 | 8 | 65 |
3 | 80 | 2 | 3 | 40 |
4 | 150 | 4 | 10 | 80 |
求回归方程 y^=β^0+β^1x1+β^2x2+β^3x3\hat{y} = \hat{\beta}_0 + \hat{\beta}_1 x_1 + \hat{\beta}_2 x_2 + \hat{\beta}_3 x_3y^=β^0+β^1x1+β^2x2+β^3x3
计算步骤
- 构造矩阵 因变量向量:y=(50654080)\boldsymbol{y} = \begin{pmatrix} 50 \\ 65 \\ 40 \\ 80 \end{pmatrix}y=50654080 设计矩阵:X=(110025112038180231150410)\boldsymbol{X} = \begin{pmatrix} 1 & 100 & 2 & 5 \\ 1 & 120 & 3 & 8 \\ 1 & 80 & 2 & 3 \\ 1 & 150 & 4 & 10 \end{pmatrix}X=111110012080150232458310
- 计算 XTX\boldsymbol{X}^T \boldsymbol{X}XTX 和 XTy\boldsymbol{X}^T \boldsymbol{y}XTy XTX=(445011264505330012703110111270337526311075198)\boldsymbol{X}^T \boldsymbol{X} = \begin{pmatrix} 4 & 450 & 11 & 26 \\ 450 & 53300 & 1270 & 3110 \\ 11 & 1270 & 33 & 75 \\ 26 & 3110 & 75 & 198 \end{pmatrix}XTX=445011264505330012703110111270337526311075198 XTy=(235264506851685)\boldsymbol{X}^T \boldsymbol{y} = \begin{pmatrix} 235 \\ 26450 \\ 685 \\ 1685 \end{pmatrix}XTy=235264506851685
- 求逆矩阵 (XTX)−1(\boldsymbol{X}^T \boldsymbol{X})^{-1}(XTX)−1
通过矩阵求逆运算(可借助工具):
(XTX)−1≈(3.21−0.02−1.530.08−0.020.00020.005−0.001−1.530.0050.15−0.030.08−0.001−0.030.02)(\boldsymbol{X}^T \boldsymbol{X})^{-1} \approx \begin{pmatrix} 3.21 & -0.02 & -1.53 & 0.08 \\ -0.02 & 0.0002 & 0.005 & -0.001 \\ -1.53 & 0.005 & 0.15 & -0.03 \\ 0.08 & -0.001 & -0.03 & 0.02 \end{pmatrix}(XTX)−1≈3.21−0.02−1.530.08−0.020.00020.005−0.001−1.530.0050.15−0.030.08−0.001−0.030.02
- 计算参数估计
β^=(XTX)−1XTy≈(5.20.32.51.1)\boldsymbol{\hat{\beta}} = (\boldsymbol{X}^T \boldsymbol{X})^{-1} \boldsymbol{X}^T \boldsymbol{y} \approx \begin{pmatrix} 5.2 \\ 0.3 \\ 2.5 \\ 1.1 \end{pmatrix}β^=(XTX)−1XTy≈5.20.32.51.1
结果
回归方程为:
y^=5.2+0.3x1+2.5x2+1.1x3\hat{y} = 5.2 + 0.3x_1 + 2.5x_2 + 1.1x_3y^=5.2+0.3x1+2.5x2+1.1x3
含义:在其他变量不变时,房屋面积每增加 1 平方米,房价平均增加 0.3 万元;房间数每增加 1 间,房价平均增加 2.5 万元;楼层每增加 1 层,房价平均增加 1.1 万元。
三、总结
多元线性回归通过矩阵形式扩展了简单回归,核心是利用最小二乘法求解正规方程得到参数估计。其推导依赖矩阵运算和求导法则,关键在于将高维问题转化为矩阵方程求解。案例验证了计算逻辑,实际应用中需注意多重共线性对参数估计的影响(即 XTX\boldsymbol{X}^T \boldsymbol{X}XTX 不可逆的情况)。