矩阵、线性代数
目录
1. 向量
2. 线性组合、张成的空间、基
3. 矩阵与线性变换(将矩阵看作空间变换)
4. 矩阵乘法与线性变换复合
三维空间的线性变换
5. 行列式
三维空间中:
计算行列式:
6. 逆矩阵、列空间与零空间
秩、列空间、零空间
非方阵
7. 点积与对偶性
8.1 叉积的标准介绍
8.2 以线性变换的目光看叉积(叉积所得向量的几何意义)
9. 基变换
10. 特征向量与特征值
特征基
11. 抽象向量空间
1. 向量
几何:向量是一个箭头,以xy坐标系上的原点为起点,有大小和方向。
数学:向量是有序的数字列表。第一个数代表沿x轴走多远,第二个数代表沿y轴走多远。正负表示方向。
竖着写二维向量是为了和点的坐标做区分。
向量加法:
数乘:缩放向量
2. 线性组合、张成的空间、基
向量:缩放向量并且相加
i, j 是xy坐标系的“基向量“。
(3,2)=3i+2j (标量*矢量)
那么选择不同的基向量呢?每当我们用数字描述向量时,它都依赖于我们在使用的基。
两个数乘向量的和被称为这两个向量的线性组合。
v和w全部线性组合构成的向量集合称为”张成的空间“。张成的空间可能是点(基向量为0向量),可能是直线(基向量共线),也可能是无限大的二维平面。
考虑一个向量时,把它看作箭头,考虑多个向量时,将它看作点(避免拥挤)。
u、w、v三维空间中,第三个向量的改变可视为它将前两个向量张成的平面沿它的方向来回移动,从而扫过整个空间。
三个自由变化的标量可得到空间中所有的三维向量。
若存在第三个向量落在前两个向量张成的空间中,即一组向量中至少有一个是多余的,没有对张成空间做出任何贡献,则可移除其中一个。
当这种情况发生时,我们称他们是线性相关的。
因此,向量空间的一组基是张成该空间的一个线性无关向量集。
线性组合->线性相关->线性变换
3. 矩阵与线性变换(将矩阵看作空间变换)
接收一个向量并输出一个向量的变换。使用变换是暗示用“运动”去思考。
线性变换定义:保持网格线平行且等距分布。(变换后直线依然是直线,原点保持固定)。是操纵空间的一种手段。
掌握了基向量的变换,就等于掌握了所有向量的变换。
2*2矩阵:
xy向量作用于abcd矩阵,ac相当于i,bd相当于j。矩阵前后很重要。
把矩阵列看作他们的基向量,把矩阵乘法看作他们的线性变换。
逆时针旋转90°:
4. 矩阵乘法与线性变换复合
下图中的乘积从右向左读,先旋转后剪切。
两个矩阵相乘-->两个线性变换相继作用,分列计算,计算变换后的i,j。
矩阵中(AB)C=A(BC), 左右都是先作C矩阵的线性变换,再做B,A。
三维空间的线性变换
例:沿y轴旋转90°。
计算线性变换后的位置:
5. 行列式
行列式:计算拉伸或压缩后空间的变化。二维空间中则是计算面积的缩放比例。
eg.一个矩阵的行列式=3,就意味着它将一个区域的面积变为原来的3倍。
一个二维线性变换的行列式=0,意味着他将整个区域变换到一条线,甚至一个点上。
因此,只要检验一个矩阵的行列式是否等于0,我们就可以了解这个矩阵所代表的变换是否将空间压缩到更小的维度上。
行列式=0,则存在一个基向量与其他基向量的线性相关的。
行列式=负值,则说明它将空间翻转了。
原本j在i的左边,翻转后j在i的右边。
三维空间中:
右手定则,行列式为正。左手定则,行列式为负。
计算行列式:
二阶:
ad分别说明了基向量在原方向上拉伸倍数,bc项说明平行四边形在对角方向拉伸或压缩了多少。
三阶:
6. 逆矩阵、列空间与零空间
只要A的行列式不为0,求A的逆变换即可求出x。
A的行列式为0,则无法实现从低维到高维的变换,不存在A的逆矩阵。
计算:
秩、列空间、零空间
秩:变换后空间的维数。
三阶矩阵将空间压缩成一维时,我们称这个变换的秩为1,其行列式=0。
三阶矩阵将空间压缩成二维时,我们称这个变换的秩为2,其行列式=0。
若行列式≠0,空间仍是三维的,则说明秩为3。
所有可能变换的结果,被称为矩阵的“列空间”
当秩=列数时,称为满秩。
零向量一定在列空间中。零空间有助于我们理解所有可能的解的集合。
当v向量处于矩阵A的列所张成的空间上,方程就有解。
非方阵
(1)二维输入,三维输出:
2*2 -> 3*2
实际并没有升维,变换后为三维空间中过原点的一个平面。
因为列空间的维数和输入空间的维数相等,这个矩阵仍是满秩的。
(2)三维到二维:
线性变换:
三列表示有三个基向量,每个变换后的基向量用两个坐标描述,所以他们一定落在二维空间中。
因此这是一个从三维到二维的变换,非满秩。
(3)二维到一维:
即从平面到数轴。
7. 点积与对偶性
变换矩阵的列数是基向量的个数,即输入维数。
行数是输出的维数。
点积:a在b方向的投影长度*b的长度(或者b在a方向的投影长度乘上a的长度)。因此,点积与顺序无关。若a,b方向相反,则它们的点积为负值。
若v和w的长度恰好相同,我们可以利用其中的对称性。此时v和w互为镜像。
当v变成2v,对称性被破坏,但将v变为原来的2倍并不改变w的投影长度,因此(2v)·w=2(v·w)。换个角度,将2v投影到w上,其投影长度也变为原来的2倍,但w不变,因此总体效果仍然是点积变为2倍。因此,缩放向量对点积的影响是相同的。
点积为什么和投影有所联系?因为对偶性
多维空间到一维空间(数轴)的线性变换。
假设i,j变换到一维空间后分别落在1,2上,则变换矩阵为[1,2].
[1,-2]与向量的乘法类似于向量的乘法,[1,-2]正像是一个被倾倒的向量。
从二维投影到一维
若要求出该变换矩阵,则应求出二维空间i,j变换到数轴的位置。两个位置作为变换矩阵的两列。
而将单位向量i变换到单位向量u上,通过对称轴可以看出等价于u变换到i上。(对偶性)
因此i到u的投影=u到i的投影=u的横坐标
j到u的投影=u到j的投影=u的纵坐标
变换矩阵为[ux, uy]
空间中任意向量经过投影变换的结果=投影矩阵×向量,其算式与点积的算式相同,因此将其视为点积的几何意义。
唯一的变换(多维到一维)对应唯一的向量
这就是为什么与单位向量的点积可以解读为 将向量投影到单位向量所在的直线上所得到的投影长度。
两个向量点乘,就是将其中一个向量转换为线性变换(向量作为线性变换的物质载体),作矩阵的乘积。
8.1 叉积的标准介绍
两个向量的叉积的大小=两向量构成的平行四边形的面积
顺序对叉积会有影响:v×w=-w×v,w在v的左边,结果为正(vw螺旋朝外);反之为负。
结果为负说明线性变换后空间翻转了。
与行列式的关系:
可见,当两个向量互相垂直时,面积最大;接近同向时,面积变小。
真正的叉积是两个三维向量生成一个新的三维向量。叉积的结果是向量。
向量的长度(叉积的模)是行列式。
向量的方向与平行四边形垂直。垂直平面向外,说明结果为正;反之为负。
8.2 以线性变换的目光看叉积(叉积所得向量的几何意义)
根据v和w定义一个三维到一维的线性变换。
找到它的对偶向量。
找出叉积的计算过程与几何含义的关系。
i,j,k只是在告诉我们应该把这些系数解读为一个向量的坐标。
变化的xyz产生变化的六面体
找到对偶向量p(代表一种线性变换)
什么样的向量p可以满足叉积的性质。
求平行六面体的体积=平行四边形面积*向量(x,y,z)在垂直于平行四边形上的分量。(将“六面体体积的变化率”转换成“高的变换率”)
点积和叉积的互相转换
9. 基变换
如何在不同坐标系之间进行转化?
例如在一个坐标系下,基向量为b1,b2,向量坐标为(-1,2);要将该坐标转换为正交坐标系下的坐标,应把b1和b2用正交坐标系的坐标来表示,即(2,1)和(-1,1)。
用她的语言来描述转换为用我们的语言来描述。
转换后的向量=-b1+2b2=(-4,1)
用矩阵来表示:线性变换(新坐标系下变换后的基向量的坐标)*原坐标=新坐标
矩阵的逆:从我们的语言(坐标系)转换为她的语言(坐标系)
矩阵代表线性变换
矩阵的乘积代表线性变换的复合
将珍尼佛的坐标系旋转90度:
基变换的逆<-线性变换<-基变换
A和A逆起转移作用。
10. 特征向量与特征值
线性变换后,向量依然留在自己张成的直线上,仅仅是进行拉伸或压缩。
处在该对角线上的任何向量,也仅仅进行拉伸或收缩。
这些向量被称为变换的“特征向量”,每个特征向量都有一个所属的值,即特征值,是衡量特征向量在变换中拉伸或压缩比例的因子。
特征值为负,表明这个向量倍反向。
三维空间进行线性变换中,特征向量就是其旋转轴。该情况下,相应的特征值=1,因为旋转并不缩放任何个向量。
理解线性变换的更好方式是求出他的特征向量和特征值。通过特征向量的变换来理解张成的空间的变换。
特征向量和特征值的计算:求出使这个等式成立的特征值和特征向量。
特征值把特征向量缩放λ倍(xyz坐标缩放λ倍),写成矩阵的形式就是将λ乘上单位阵。
将等号右侧的式子移到左侧:
当且仅当矩阵代表的变换将空间压缩到更低维时(行列式=0),才会存在一个非零向量,使得矩阵和它的乘积为零向量。
通过求解行列式=0来求出λ。
将λ代入[A-λI]后,设特征向量v为[x,y,z],两个矩阵相乘=0。通过求解线性方程组得出v向量。
注:属于单个特征值的特征向量可以不止在一条直线上。
例:
特征基
基向量都是特征向量,其线性变换的矩阵为对角矩阵:(除了对角元以外其他元素均为0的矩阵被称为对角矩阵,对角元是它们的特征值)
对角矩阵多次使用矩阵乘法,也只是将每个基向量与对应特征值的多次幂相乘。
如果你的变换有许多特征向量,多到你能选出一个张成全空间的集合,那么你就能变换你的坐标系,使得这些特征向量就是基向量,用新的坐标系表示。
基变换矩阵由中间矩阵的特征向量组成。
因此计算矩阵的100次幂,一种更容易的做法是先变换到特征基,在那个坐标系上计算100次幂,然后转回标准坐标系。
11. 抽象向量空间
行列式和特征值(缩放比例)与所选坐标系无关。
算子:将一个函数变换到另一个函数(如求导)。
一个函数变换是线性的:满足可加性和成比例。