当前位置: 首页 > news >正文

线性代数直觉(四):找到特征向量

想想刚才发生了什么。我们有一个优化问题:“当 v 旋转时,v^T H v 的最大值和最小值是多少?” 这似乎需要用到微积分,检查所有无穷多个方向……

但事实证明,答案直接通过这个代数方程编码在矩阵本身中!特征值就是那些极端曲率。

更深层次的原因在于:当 v 是一个特征向量,一个特殊的方向时,H·v 不再是把 v 拉向其他方向,而是指向与 v 相同的方向,只是乘以了特征值 λ。

所以:v^T H v = v^T (λv) = λ(v^T v) = λ

因为对于单位向量,v^T v = 1。

所以在特征向量方向上,“曲率”恰好等于特征值。而这些方向恰好是曲率最大和最小的地方!


这不仅仅是我们用来做曲面的 2×2 Hessian 矩阵。这是任意维度上二次优化的基本结构。

当你训练一个包含数百万个参数的神经网络时,Hessian 矩阵就是一个百万乘百万的矩阵。在这个难以理解的高维空间中,你可以问自己:“哪个方向的曲率最陡?哪个方向最平坦?”

特征值会告诉你答案:最大的特征值代表曲率最陡的方向,最小的特征值代表最平坦的谷底。

这就是我们理解优化景观的方式。这就是我们判断梯度下降法是否有效、是否停滞或是否震荡的方式。 Hessian 矩阵的特征值,它们是理解学习几何的诊断工具。

如果你想了解大模型是如何被训练的,这已经接近核心了。Hessian 矩阵、特征值、高维空间中的曲率,这些正是塑造大模型的数学领域。


考试的时候,每个人都机械地计算特征值和特征向量,却不知道为什么。但现我们先明白了为什么,先把曲率形象化了,发现了极值,然后我们再学习计算,这其实是更好的顺序。

对于之前的扁碗的Hessian矩阵:H = [[2,1] [1,4]]

我们找到了特征值:λ₁ = 3 + √2 ≈ 4.414 和 λ₂ = 3 - √2 ≈ 1.586

为了求 λ₁ = 3 + √2 的特征向量,我们求解:

(H - λ₁I)v = 0

[[2-(3+√2), 1 ][1, 4-(3+√2) ]]  [[v₁] [v₂]] = [[0] [0]]

[[-1-√2, 1 ] [1, 1-√2 ]] [[v₁] [v₂]] = [[0] [0]]

从第一行开始:(-1-√2)v₁ + v₂ = 0

所以:v₂ = (1+√2)v₁

我们可以取 v₁ = 1,因此特征向量近似为 (1, 2.414),指向曲率最大的方向。

而根据程序画的正弦曲线,最高点出现在 θ = (4.3230-3.1416)/3.1416 ≈ 0.375 π 的附近。而 tan(0.375 π) ≈ 2.42。

 

 

 

http://www.dtcms.com/a/523800.html

相关文章:

  • iis网站服务器 建立出现问题微信小程序制作费用是多少
  • 亚马逊云代理商:2025 AWS 服务器配置趋势走向怎么样?
  • 建设银行网站修改手机号湖南省和城乡住房建设厅网站
  • 云电脑与云手机的关系
  • 加性高斯白噪声和码间串扰的信道中Ungerboeck和Forney接收机的区别
  • 厨房电子秤芯片方案:SIC8833
  • 2025MathorCup大数据竞赛A题B题选题建议与分析,思路模型
  • 做网站的公司属于什么行业工商银行手机银行app下载
  • FastGateway 容器化部署与安全集成实践:技术架构与生态融合
  • 流媒体网站建设规划 所需设备网站建设方案500字
  • 非视距城市合成孔径雷达中的多径利用——论文阅读
  • 蓝牙 nRF52732 最简操作
  • 如何做简单视频网站wordpress云服务器配置
  • Spring Boot+RabbitMQ 实战:4 种交换机模式(Work/Fanout/Direct/Topic)保姆级实现
  • 【2026计算机毕业设计】基于Django的智慧办公hr招聘辅助管理系统
  • NBIOT (1) : 当世界开始“低语“
  • 酒店网站制作公司有谁做分销网站
  • Git 服务器搭建
  • Ubuntu24安装MongoDB7
  • Ubuntu 自动挂载移动硬盘
  • 如何使用Postman做接口自动化测试及完美的可视化报告?
  • 配置Centos7.6 yum镜像源
  • Flink非对齐checkpoint踩坑记
  • 使用 WebSocket 实现手机控制端和电脑展示端的实时通信,包含断线重连功能。
  • 服装网站建设怎么写wordpress strip_tags
  • 一文讲清:数据清洗、数据中台、数据仓库、数据治理
  • 【C++ STL】探索STL的奥秘——vector底层的深度剖析和模拟实现!
  • STM32CUBEMX安装离线库
  • 体验 Suno v5:最新的 Suno AI 音乐模型
  • 2.4 欧拉集群安装Nova计算服务