当前位置: 首页 > news >正文

线性代数直觉(五):行列式——让空间坍缩

我们来思考一下 H·v 的几何意义。H 将一个向量 v 变换成一个新的向量。通常,这种变换会旋转和拉伸 v,同时改变它的方向和长度。

但对于特殊的向量——特征向量,H 只会拉伸(或收缩)它们。它根本不会旋转它们。H·v = λv 的意思是“H 只是将 v 缩放了 λ 倍。”

现在,(H - λI)v = 0 等于 H·v - λv = 0,也就是 H·v = λv。所以我们要问:“对于哪些向量 v,H 的作用类似于简单的缩放?”这就是寻找特征向量的过程。

det(H - λI) = 0 的问题是:“对于哪些 λ 值,矩阵 (H - λI) 会使空间塌缩?” 行列式为零的矩阵会将空间压扁,这意味着存在非零向量,它会将其变为零。


想象一下二维空间,一个平面。通常,一个 2×2 矩阵会以各种方式变换这个平面:旋转、拉伸、剪切等等。但平面仍然是二维的。

但有些特殊的矩阵会“坍缩”这个平面。它们会把它压缩成一条线(一维),甚至一个点(零维)。

例如,矩阵[[1 1] [1 1]]。取每个向量 (x, y) 并将其映射到 (x+y, x+y)。注意,这两个分量是相同的!所以整个二维平面被压缩到对角线上。我们损失了一个维度。

这个矩阵的行列式是什么?零。因为行列式衡量的是“这个矩阵对面积的缩放程度是多少?”如果它从二维塌缩到一维,面积就变成零。

所以,当我们求解 det(H - λI) = 0 时,我们是在寻找使 (H - λI) 塌缩空间的 λ 值。这意味着存在非零向量 v,使得 (H - λI)v = 0,也就是 H·v = λv。


维度坍缩与 Hessian H 本身无关,H 不会使空间坍缩。H 是一个非常好的变换,可以保持维度不变。坍缩的是 (H - λI)。这是一个不同的矩阵,由 H 的对角线减去 λ 得到。

例如:H = [[2 1] [1 4]]

当 λ = 3+√2 时,我们得到:

H - λI = [[2-(3+√2), 1 ] [1, 4-(3+√2)]] = [[-1-√2, 1 ] [1, 1-√2 ]]

这个矩阵使空间坍缩。如果将它应用于特征向量 v = (1, 1+√2),则会得到零。它会将那个特定方向压扁。

原因很微妙:在那个特殊的λ值下,矩阵 (H - λI) 中的行会变得相互依赖,它们包含冗余信息!它们试图描述的约束实际上只是一个约束,而不是两个独立的约束。


所以事实是这样的:每个矩阵都有特征值,这是不可避免的。

当你解 det(H - λI) = 0 时,你总会得到解,如果你允许复数的话是这样,这些解就是特征值。但是,这一点很重要,并非每个矩阵都有实数特征值。有些矩阵只有复数特征值。

例如,一个二维的纯旋转矩阵:
[0 -1]
[1 0]

这会将每个向量旋转 90°。没有哪个方向只是缩放,每个方向都会旋转。所以它没有实数特征向量,只有复数特征向量。

对于任何矩阵,特征值和特征向量代表着那些特殊的方向,在这些方向上,变换会简化,变换不是旋转和拉伸,而是缩放。找到它们需要寻找 (M - λI) 何时失去秩,维度何时坍缩。特别是对于 Hessian 矩阵,由于它们是对称的,所以这个几何故事与曲率完美地联系在一起。特征值就是主曲率,特征向量就是主方向。

但是 Hessian 矩阵很特别!它是对称的(H = Hᵀ),因为二阶混合偏导数可以交换顺序。也就是说它等于它自己的转置矩阵。并且有一个很棒的定理:对称矩阵总是有实数特征值和垂直的特征向量。这就是为什么我们的 Hessian 分析如此清晰的原因。曲率方向总是实数,总是垂直的。几何结构保证完美。

 

http://www.dtcms.com/a/528379.html

相关文章:

  • word文档模板通过poi-tl导出问题注意点
  • Java在大数据分布式存储中的创新实践
  • ThinkPHP5 RCE+Linux find提权渗透实战:原理+复现(CVE-2018-20062)
  • 昆明网站排名优化电商网站的功能
  • 代码随想录Day59|dijkstra(堆优化版)精讲、Bellman_ford 算法精讲
  • 四川住建厅官方网站的网址教务管理系统学生登录入口
  • [MySQL]数据类型
  • 3w字一文讲透Java IO
  • 多模态学习大纲笔记(未完成)
  • 组织学习障碍:自我证明的陷阱
  • 【数据结构】顺序表的实现
  • 可以做兼职的网站质量好网站建设多少钱
  • 无声的战争:自动驾驶系统中的资源抢占、调度与生存法则
  • 30-机器学习与大模型开发数学教程-3-4 矩阵的逆与伪逆
  • 【大语言模型 104】LLM推理服务架构:从单机到分布式的演进之路
  • Rust所有权机制解析:内存安全的基石与实战指南
  • 个人做商业网站需要什么如何判断网站数据库类型
  • Spring容器进化论:从BeanFactory到ApplicationContext
  • 20.7 零样本多模态实战:CLIP模型如何让ChatPPT图像识别吞吐量飙升406%
  • 可以做平面设计兼职的网站佛山市网站建设分站哪家好
  • win11系统下配置c++机器学习库mlpack
  • [人工智能-大模型-72]:模型层技术 - 模型训练六大步:①数据预处理 - 基本功能与对应的基本组成函数
  • java基础-13 : 双列集合(Map)
  • 【十年后台管理系统】Redis的使用
  • SSM框架-MyBatis2
  • 深入理解JVM垃圾回收机制:从原理到实践
  • Spring的后处理器
  • 本地佛山顺德网站设计深圳市宝安区西乡街道
  • 监控 Linux 系统上的内存使用情况
  • 湖北省住房与建设厅网站高品质的网站开发