【深度学习与实战】2.3、线性回归模型与梯度下降法先导案例--最小二乘法(向量形式求解)
为了求解损失函数 对 
 的导数,并利用最小二乘法向量形式求解 
 的值
这是线性回归的平方误差损失函数,目标是最小化预测值  与真实值 
 之间的差距。
损失函数:
 考虑多个样本的情况,损失函数为所有样本的平方误差之和:
                      
                                                         
- 是损失函数 
- 是 - 的设计矩阵( - 个样本, - 个特征)。 
- 是 - 的权重向量。 
- 是 - 的目标值向量。 
- 对于两个列向量和 ,它们的点积(内积)就是 , 是向量 的转置 
针对  
函数求导,有一下性质:
对每项求导
 第一项   
 
        将  公式代入得
          
  
 
 
          
        其中    为 
, 
 为 
,
 为 
。
第二项  
 
        将  公式代入得
       
         
        其中  为 
,
 为 
第三项 
 
        将  代入得
        
        
        其中  为 
,
 为 
第四项 没有  看作常数项 常数项的导数为0
 看作常数项 常数项的导数为0
 
合并项得
        
     
         
                      
                     
 令  ,得
,得
 
 
 (
 可逆时)
和
互为逆矩阵  
得出结果

解释:
,
与
互逆
逆矩阵的定义
如果 是 
的逆矩阵,则满足:
(单位矩阵 类似于数值乘法中的 1)
 即无论 左乘还是右乘 
,结果均为单位矩阵。
必要条件
和
必须是方阵(行数=列数)
必须可逆,矩阵的行列式不为零(即行列式 
)
直观理解
 逆矩阵的作用类似于“倒数”。例如,数值中 ,类似地,矩阵中 
。
单位矩阵 在矩阵乘法中的作用类似于数值乘法中的 1。
示例验证
取矩阵 ,其行列式
,故可逆。
计算逆矩阵:
(1) 第一行第一列的元素 ( )
)
 
(2) 第一行第二列的元素 ( )
)
 
(3) 第一行第二列的元素 ( )
)
 
(4) 第一行第二列的元素 ( )
)
 
 

