当前位置: 首页 > news >正文

神经网络之线性变换

一、什么是线性变换(Linear Transformation)

1️⃣ 定义

设有一个从向量空间到向量空间的映射
T:Rn→Rm T: \mathbb{R}^n \to \mathbb{R}^m T:RnRm
当且仅当它满足以下两个条件时,称 (T) 为线性变换

{T(x+y)=T(x)+T(y) T(cx)=cT(x)∀c∈R \begin{cases} T(\mathbf{x} + \mathbf{y}) = T(\mathbf{x}) + T(\mathbf{y}) \ T(c\mathbf{x}) = cT(\mathbf{x}) \quad \forall c \in \mathbb{R} \end{cases} {T(x+y)=T(x)+T(y) T(cx)=cT(x)cR

也就是说:

线性变换保持加法数乘结构,它不会破坏向量之间的线性关系。


2️⃣ 直观理解

线性变换可以看作一种“纯粹的空间拉伸、旋转、翻转或投影”。
它让“原点仍然映射到原点”,所有通过原点的直线仍然映射为直线。
(而平移不是线性变换,因为平移会把原点移开。)


3️⃣ 矩阵形式表示

所有线性变换都可以写作矩阵乘法:
T(x)=Ax T(\mathbf{x}) = A\mathbf{x} T(x)=Ax
其中 (A) 是一个矩阵。
因此线性变换的所有性质,都可以通过矩阵的性质来分析。


二、常见的线性变换类型

线性变换种类很多,常见的有以下几类,每一类都有清晰的几何意义👇

类型常见形式几何含义是否线性
缩放(Scaling)(T(x,y)=(kx,ky))(T(x,y)=(kx, ky))(T(x,y)=(kx,ky))放大或缩小
旋转(Rotation)(R(θ)x)(R(\theta)\mathbf{x})(R(θ)x)保持长度与角度
反射(Reflection)(x−2(n⋅x)n)(\mathbf{x}-2(\mathbf{n}\cdot\mathbf{x})\mathbf{n})(x2(nx)n)关于直线/平面翻转
投影(Projection)((u⋅x)u)((\mathbf{u}\cdot\mathbf{x})\mathbf{u})((ux)u)投影到某方向或平面上
错切(Shear)(T(x,y)=(x+ky,y))(T(x,y)=(x+ky,y))(T(x,y)=(x+ky,y))平行方向滑动
零变换(Zero Map)(T(x)=0)(T(\mathbf{x})=\mathbf{0})(T(x)=0)所有向量变为零
单位变换(Identity)(T(x)=x)(T(\mathbf{x})=\mathbf{x})(T(x)=x)不改变任何向量
平移(Translation)(T(x)=x+b)(T(\mathbf{x})=\mathbf{x}+\mathbf{b})(T(x)=x+b)整体移动❌(非线性)

三、各类型的线性本质与几何理解


(1)缩放变换(Scaling)

T(x,y)=(kx,ky) T(x, y) = (kx, ky) T(x,y)=(kx,ky)
矩阵形式:
A=[k0 0k] A = \begin{bmatrix} k & 0\ 0 & k \end{bmatrix} A=[k0 0k]

验证线性:
T(x+y)=k(x+y)=kx+ky=T(x)+T(y) T(\mathbf{x}+\mathbf{y})=k(\mathbf{x}+\mathbf{y})=k\mathbf{x}+k\mathbf{y}=T(\mathbf{x})+T(\mathbf{y}) T(x+y)=k(x+y)=kx+ky=T(x)+T(y)
T(cx)=ckx=cT(x) T(c\mathbf{x})=ck\mathbf{x}=cT(\mathbf{x}) T(cx)=ckx=cT(x)
✅ 满足线性条件。

几何意义:

  • 当 (k>1) → 放大;
  • 当 (0<k<1) → 缩小;
  • 当 (k<0) → 翻转方向并缩放。

(2)旋转变换(Rotation)

二维情况下:
R(θ)=[cos⁡θ−sin⁡θ sin⁡θcos⁡θ] R(\theta) = \begin{bmatrix} \cos\theta & -\sin\theta\ \sin\theta & \cos\theta \end{bmatrix} R(θ)=[cosθsinθ sinθcosθ]
T(x)=R(θ)x T(\mathbf{x}) = R(\theta)\mathbf{x} T(x)=R(θ)x

验证线性:
R(θ)(x+y)=R(θ)x+R(θ)y,R(θ)(cx)=cR(θ)x R(\theta)(\mathbf{x}+\mathbf{y})=R(\theta)\mathbf{x}+R(\theta)\mathbf{y},\quad R(\theta)(c\mathbf{x})=cR(\theta)\mathbf{x} R(θ)(x+y)=R(θ)x+R(θ)y,R(θ)(cx)=cR(θ)x
✅ 满足线性定义。

几何意义:
旋转保持长度与角度,只改变方向,是正交线性变换的一种。
RTR=I,det⁡R=+1 R^T R = I, \quad \det R = +1 RTR=I,detR=+1


(3)反射变换(Reflection)

关于某个单位法向量 (n)(\mathbf{n})(n) 的反射:
T(x)=x−2(n⋅x)n T(\mathbf{x}) = \mathbf{x} - 2(\mathbf{n}\cdot\mathbf{x})\mathbf{n} T(x)=x2(nx)n

验证线性:
T(x+y)=T(x)+T(y),T(cx)=cT(x) T(\mathbf{x}+\mathbf{y}) = T(\mathbf{x})+T(\mathbf{y}),\quad T(c\mathbf{x})=cT(\mathbf{x}) T(x+y)=T(x)+T(y),T(cx)=cT(x)
✅ 满足线性。

几何意义:

  • 反射会翻转向量在法向量方向上的分量;
  • 保持平面内分量不变;
  • 改变方向(det⁡R=−1))(\det R = -1))(detR=1)

例如关于 x 轴反射:
T(x,y)=(x,−y),A=[10 0−1] T(x, y) = (x, -y) ,\quad A = \begin{bmatrix} 1 & 0\ 0 & -1 \end{bmatrix} T(x,y)=(x,y),A=[10 01]


(4)投影变换(Projection)

将向量投影到方向 (u)(\mathbf{u})(u)(单位向量)上:
T(x)=(u⋅x)u T(\mathbf{x}) = (\mathbf{u}\cdot\mathbf{x})\mathbf{u} T(x)=(ux)u

验证线性:
T(x+y)=(u⋅(x+y))u=T(x)+T(y) T(\mathbf{x}+\mathbf{y}) = (\mathbf{u}\cdot(\mathbf{x}+\mathbf{y}))\mathbf{u} = T(\mathbf{x})+T(\mathbf{y}) T(x+y)=(u(x+y))u=T(x)+T(y)
T(cx)=c(u⋅x)u=cT(x) T(c\mathbf{x}) = c(\mathbf{u}\cdot\mathbf{x})\mathbf{u} = cT(\mathbf{x}) T(cx)=c(ux)u=cT(x)
✅ 满足线性。

几何意义:

  • 把向量“垂直压”到某一方向或平面;
  • 长度减小(除非在方向上)。

(5)错切变换(Shear)

T(x,y)=(x+ky,y),A=[1k 01] T(x,y) = (x + ky, y) ,\quad A = \begin{bmatrix} 1 & k\ 0 & 1 \end{bmatrix} T(x,y)=(x+ky,y),A=[1k 01]

验证线性:
T(x+y)=T(x)+T(y),T(cx)=cT(x) T(\mathbf{x}+\mathbf{y})=T(\mathbf{x})+T(\mathbf{y}), \quad T(c\mathbf{x})=cT(\mathbf{x}) T(x+y)=T(x)+T(y),T(cx)=cT(x)
✅ 满足线性。

几何意义:

  • 将空间“斜着推开”,形状改变但平行性保持;
  • 各向量的比例关系依旧保持。

(6)平移变换(Translation)【⚠️非线性】

T(x)=x+b T(\mathbf{x}) = \mathbf{x} + \mathbf{b} T(x)=x+b
验证:
T(cx)=cx+b≠cT(x)=c(x+b) T(c\mathbf{x}) = c\mathbf{x} + \mathbf{b} \neq cT(\mathbf{x}) = c(\mathbf{x}+\mathbf{b}) T(cx)=cx+b=cT(x)=c(x+b)
❌ 不满足线性定义。

几何意义:

  • 平移改变了原点位置;
  • 因此破坏了“原点到原点”的线性结构。

四、总结对比表

类型线性几何效果矩阵形式特征
缩放放大/缩小diag(k,k)diag(k,k)diag(k,k)改变长度,保持方向
旋转绕原点旋转正交矩阵,det=+1保长度与角度
反射镜像翻转正交矩阵,det=-1保长度但翻方向
投影压到某方向(uuT)(\mathbf{u}\mathbf{u}^T)(uuT)缩短长度
错切平行推移上三角矩阵改变形状
平移整体移动含常数项原点被移走

五、总结

  • 线性变换的核心本质: 保持加法与数乘;
  • 所有线性变换都可由矩阵乘法表示: (T(x)=Ax)(T(\mathbf{x}) = A\mathbf{x})(T(x)=Ax)
  • 不同类型的线性变换只是矩阵形式不同,对空间的作用方式不同;
  • **非线性变换(如平移)**破坏原点关系,因此不线性。
http://www.dtcms.com/a/568514.html

相关文章:

  • Fastlane 结合 开心上架(Appuploader)命令行版本实现跨平台上传发布 iOS App 免 Mac 自动化上架实战全解析
  • 大连网站建设平台宁夏考试教育网站
  • 微信网站对接室内设计师报考官网
  • Ceph常用的三种存储操作
  • 【前端】从零开始搭建现代前端框架:React 19、Vite、Tailwind CSS、ShadCN UI 完整实战教程-第1章:项目概述与技术栈介绍
  • react使用ag-grid及常用api笔记
  • MiniEngine学习笔记 : CommandListManager
  • 人工智能讲师数据治理讲师叶梓《数字化转型与大模型技术应用培训提纲》
  • 1.7.课设实验-数据结构-二叉树-文件夹创建系统
  • 互联网大学生创新创业项目计划书seo网址查询
  • 同时打开两个浏览器页面,关闭 A 页面的时候,要求 B 页面同时关闭,怎么实现?
  • 什么是react?
  • Arbess零基础学习 - 使用Arbess+GitLab实现 React.js 项目自动化构建/主机部署
  • 从事网站开发需要的证书网页设计免费网站推荐
  • 任何数据结构的构造或初始化,都应指定大小,避免数据结构无限增长吃光内存【示例】
  • 【开题答辩实录分享】以《基于java的宿舍楼洗衣机预约管理系统》为例进行答辩实录分享
  • 如何在iPhone 17/16/15上显示电池百分比
  • 网站换主机引擎网站推广法
  • 【普中STM32F1xx开发攻略--标准库版】-- 第 13 章 STM32 位带操作
  • MySQL绿色版完整教程:下载、安装、配置与远程访问
  • 集合(开发重点)
  • 如何通过第三方API接口获取拼多多店铺信息?
  • ⸢ 拾贰 ⸥⤳ 实战攻防演练:红蓝对抗 有效性检验
  • Flutter 与 Native的比较
  • 做网站要用到什么泰安有哪些景点
  • Java EE - Thread类的基本使用
  • 社会真相社会现实丛林社会强者思维社会关系价值交换社会法则社会圈子社会阶层电子书籍PDF
  • 轻量化的网络模型:SqueezeNet 详解与复现(已解决)
  • Adobe Acrobat DC PDF如何批量文本替换
  • 帝国cms 微信小程序获取手机号码的api接口