机器人、具身智能的起步——线性系统理论|【三】线性、因果与时不变
机器人、具身智能的起步——线性系统理论|【三】线性、因果与时不变
3.1 线性性、因果性与时不变性 (Linearity, Causality and Time Invariance)
本节正式定义了线性系统 (Linear Systems) 的概念和一些基本属性。
1. 通用系统表示 (General System Representation)
讲义中使用 y=T(u,x0)y=\mathcal{T}\left(u, x_{0}\right)y=T(u,x0) 表示一个通用的动态系统,其中:
- yyy 是输出 (Output)
- uuu 是输入 (Input)
- x0x_0x0 是初始条件 (Initial Conditions)
2. 线性性 (Linearity)
一个系统 y=T(u,x0)y=\mathcal{T}\left(u, x_{0}\right)y=T(u,x0) 是线性的,如果对于任意输入 u1u_1u1, u2u_2u2 和任意初始条件 x1,x2x_1, x_2x1,x2,以及任意两个实数常数 α1,α2\alpha_1, \alpha_2α1,α2,总存在某个初始条件 x3x_3x3,使得以下叠加原理 (Superposition Principle) 成立:
T(α1u1+α2u2,α1x1+α2x2)=α1T(u1,x1)+α2T(u2,x2)\mathcal{T}(\alpha_1 u_1 + \alpha_2 u_2, \alpha_1 x_1 + \alpha_2 x_2) = \alpha_1 \mathcal{T}(u_1, x_1) + \alpha_2 \mathcal{T}(u_2, x_2)T(α1u1+α2u2,α1x1+α2x2)=α1T(u1,x1)+α2T(u2,x2)
核心推论:
线性系统的全部解等于一个特解 (Particular Solution)(由输入引起,即 T(u,0)\mathcal{T}(u, 0)T(u,0))加上齐次解 (Homogeneous Solution)(由初始条件引起,零输入响应 Zero-Input Response,即 T(0,xh)\mathcal{T}(0, x_h)T(0,xh))。
- 状态空间 (State-Space, SS) 线性系统中,yZSy_{ZS}yZS (零状态响应) 是特解,yZIy_{ZI}yZI (零输入响应) 是齐次解。
3. 因果性 (Causality)
一个连续时间系统 (Continuous-Time, CT System) 是因果的,如果对于任何初始条件 x0x_0x0、任何输入 u(t)u(t)u(t) 和 uˉ(t)\bar{u}(t)uˉ(t),以及每个固定的 T>0T>0T>0,只要两个输入在时间区间 [t0,t0+T)[t_0, t_0+T)[t0,t0+T) 内完全相同 (uˉ(t)=u(t)\bar{u}(t)=u(t)uˉ(t)=u(t)),那么它们对应的输出在同一时间区间内也完全相同 (yˉ(t)=y(t)\bar{y}(t)=y(t)yˉ(t)=y(t))。
- 通俗理解: 系统的当前输出 y(t)y(t)y(t) 仅取决于当前及过去的输入 u(τ)(τ≤t)u(\tau) (\tau \leq t)u(τ)(τ≤t),而不依赖于未来的输入。因此,因果系统也称为非 anticipative 的 (Nonanticipative),即不能“预见”未来的输入。
- 离散时间系统 (Discrete-Time, DT System) 的定义类似,只是时间变量取整数。
- ✅ 状态空间线性系统都是因果的。
4. 时不变性 (Time Invariance)
一个连续时间系统 (CT System) 是时不变的,如果对于任何初始条件 x0x_0x0、任何输入 u(t)u(t)u(t) 和 uˉ(t)\bar{u}(t)uˉ(t),以及每个固定的 T≥0T \geq 0T≥0,如果输入 uˉ(t)\bar{u}(t)uˉ(t) 是 u(t)u(t)u(t) 的一个时移版本 (uˉ(t)=u(t+T)\bar{u}(t)=u(t+T)uˉ(t)=u(t+T)),那么输出 yˉ(t)\bar{y}(t)yˉ(t) 也同样是 y(t)y(t)y(t) 的相同时移版本 (yˉ(t)=y(t+T)\bar{y}(t)=y(t+T)yˉ(t)=y(t+T))。
- 通俗理解: 系统的特性不随时间改变。如果一个输入产生某个输出,那么无论什么时候施加这个输入,产生的输出形状都是相同的,仅仅是在时间上发生了平移。
- 时变系统 (Time-Varying System) 则不满足这个性质。
- ✅ 状态空间线性时不变系统 (LTI Systems) 是“时不变的”。
练习举例:
- y(t)=cos(u(t))y(t) = \cos(u(t))y(t)=cos(u(t)): 非线性 (Nonlinear), 因果, 时不变。
- y(t)=tu(t)y(t) = t u(t)y(t)=tu(t): 线性, 因果, 时变 (因为系数
t
随时间变化)。 - y(t)=∫t0tu2(τ+1)dτy(t) = \int_{t_0}^{t} u^2(\tau+1) d\tauy(t)=∫t0tu2(τ+1)dτ: 非线性, 非因果 (因为积分项 u(τ+1)u(\tau+1)u(τ+1) 依赖于未来时刻 τ+1>t\tau+1 > tτ+1>t 的输入)。
3.2 线性系统的脉冲响应 (Impulse Response of Linear Systems)
这是第一种输入-输出 (I/O) 描述方式,只关心由输入引起的响应 (y=T(u)y = \mathcal{T}(u)y=T(u))。
核心思想:
任何输入信号 u(t)u(t)u(t) 都可以近似看作是无数个强度不同、时间不同的脉冲 (Pulse) 的叠加。对于一个单输入单输出系统 (SISO System),利用系统的线性性,其输出可以表示为这些脉冲响应的叠加求和(积分):
y(t)=∫t0∞g(t,τ)u(τ)dτy(t) = \int_{t_0}^{\infty} g(t, \tau) u(\tau) d\tauy(t)=∫t0∞g(t,τ)u(τ)dτ
其中 g(t,τ)g(t, \tau)g(t,τ) 称为脉冲响应函数 (Impulse Response Function),它表示在时刻 τ\tauτ 施加一个单位脉冲,在时刻 ttt 观测到的输出值。
推广到多输入多输出系统 (MIMO Systems):
对于有 nin_ini 个输入、non_ono 个输出的线性系统,存在一个脉冲响应矩阵 (Impulse Response Matrix, IRM) G(t,τ)G(t, \tau)G(t,τ),使得系统输出为:
y(t)=∫t0∞G(t,τ)u(τ)dτy(t) = \int_{t_0}^{\infty} G(t, \tau) u(\tau) d\tauy(t)=∫t0∞G(t,τ)u(τ)dτ
- IRM G(t,τ)G(t, \tau)G(t,τ) 是一个 no×nin_o \times n_ino×ni 的矩阵。
- 其第 (i,j)(i, j)(i,j) 个元素 Gij(t,τ)G_{ij}(t, \tau)Gij(t,τ) 表示:仅在第 jjj 个输入口于时刻 τ\tauτ 施加一个单位脉冲时,在第 iii 个输出口于时刻 ttt 测量到的响应。
重要说明:
- IRM 只能描述系统的零状态响应 (yZSy_{ZS}yZS),无法反映由非零初始条件引起的齐次解 (yZIy_{ZI}yZI)。
- IRM 适用于所有线性系统,而不仅仅是状态空间描述的系统。
与状态空间模型的关系:
对于一个状态空间线性系统 (A(t),B(t),C(t),D(t))(A(t), B(t), C(t), D(t))(A(t),B(t),C(t),D(t)),其脉冲响应矩阵为:
G(t,τ)=C(t)Φ(t,τ)B(τ)+D(t)δ(t−τ)G(t, \tau) = C(t)\Phi(t, \tau)B(\tau) + D(t)\delta(t-\tau)G(t,τ)=C(t)Φ(t,τ)B(τ)+D(t)δ(t−τ)
其中 Φ(t,τ)\Phi(t, \tau)Φ(t,τ) 是状态转移矩阵 (State Transition Matrix, STM)。
线性时不变系统 (LTI Systems) 的简化:
如果系统是因果且时不变的,则脉冲响应矩阵只取决于时间差:G(t,τ)=G(t−τ)G(t, \tau) = G(t - \tau)G(t,τ)=G(t−τ)。输出方程可简化为卷积积分 (Convolution Integral):
y(t)=∫0tG(t−τ)u(τ)dτ或简写为y(t)=G(t)∗u(t)y(t) = \int_{0}^{t} G(t - \tau) u(\tau) d\tau \quad \text{或简写为} \quad y(t) = G(t) * u(t)y(t)=∫0tG(t−τ)u(τ)dτ或简写为y(t)=G(t)∗u(t)
卷积运算在时域比较复杂,但通过积分变换可以转化为简单的代数运算,这就引出了第二种I/O描述。
3.3 LTI 系统的传递函数 (Transfer Function of LTI Systems)
本节专注于因果线性时不变系统 (Causal LTI Systems)。
数学工具:
为了简化卷积运算,我们使用:
- 拉普拉斯变换 (Laplace Transform):用于连续时间 (CT) 系统。
- 定义:x^(s)=L[x(t)]=∫0∞x(t)e−stdt\hat{x}(s) = \mathcal{L}[x(t)] = \int_{0}^{\infty} x(t)e^{-st} dtx^(s)=L[x(t)]=∫0∞x(t)e−stdt,其中 sss 是复数。
- 重要性质:时域卷积等于复频域乘法。L[g(t)∗u(t)]=g^(s)⋅u^(s)\mathcal{L}[g(t)*u(t)] = \hat{g}(s) \cdot \hat{u}(s)L[g(t)∗u(t)]=g^(s)⋅u^(s)
- Z 变换 (z-Transform):用于离散时间 (DT) 系统。
- 定义:x^(z)=Z[x(t)]=∑t=0∞x(t)z−t\hat{x}(z) = \mathcal{Z}[x(t)] = \sum_{t=0}^{\infty} x(t)z^{-t}x^(z)=Z[x(t)]=∑t=0∞x(t)z−t,其中 zzz 是复数。
- 重要性质:时域卷积等于Z域乘法。Z[g(t)∗u(t)]=g^(z)⋅u^(z)\mathcal{Z}[g(t)*u(t)] = \hat{g}(z) \cdot \hat{u}(z)Z[g(t)∗u(t)]=g^(z)⋅u^(z)
传递函数定义 (Transfer Function Definition):
一个因果LTI系统的传递函数矩阵 (Transfer Function Matrix, TFM) 定义为其脉冲响应矩阵的拉普拉斯变换(CT)或Z变换(DT):
- CT: G^(s)≜L[G(t)]\hat{G}(s) \triangleq \mathcal{L}[G(t)]G^(s)≜L[G(t)]
- DT: G^(z)≜Z[G(t)]\hat{G}(z) \triangleq \mathcal{Z}[G(t)]G^(z)≜Z[G(t)]
核心定理:
在复频域中,系统输出等于传递函数矩阵乘以输入:
- CT: y^(s)=G^(s)u^(s)\hat{y}(s) = \hat{G}(s) \hat{u}(s)y^(s)=G^(s)u^(s)
- DT: y^(z)=G^(z)u^(z)\hat{y}(z) = \hat{G}(z) \hat{u}(z)y^(z)=G^(z)u^(z)
这极大地简化了系统输入输出关系的分析和计算。
从状态空间模型求传递函数:
对于一个状态空间LTI系统:
- 连续时间 (CT): x˙=Ax+Bu,y=Cx+Du\dot{x} = Ax + Bu, \quad y = Cx + Dux˙=Ax+Bu,y=Cx+Du
- 其传递函数为:G^(s)=C(sI−A)−1B+D\hat{G}(s) = C(sI - A)^{-1}B + DG^(s)=C(sI−A)−1B+D
- 离散时间 (DT): x(t+1)=Ax(t)+Bu(t),y(t)=Cx(t)+Du(t)x(t+1) = Ax(t) + Bu(t), \quad y(t) = Cx(t) + Du(t)x(t+1)=Ax(t)+Bu(t),y(t)=Cx(t)+Du(t)
- 其传递函数为:G^(z)=C(zI−A)−1B+D\hat{G}(z) = C(zI - A)^{-1}B + DG^(z)=C(zI−A)−1B+D
3.4 例子 (Example)
(讲义中例子未给出具体内容,通常会是应用上述公式计算给定系统的脉冲响应或传递函数)。
总结 (Summary)
这份讲义介绍了描述线性系统的两种主要输入-输出模型:
- 时域模型:脉冲响应 (Impulse Response) - 物理意义清晰,适用于所有线性系统。
- 复频域模型:传递函数 (Transfer Function) - 计算简便,仅适用于LTI系统。
这两种模型专注于系统的“外部”输入输出特性,而不涉及系统内部的“状态”变量。它们与状态空间模型之间可以相互转换,如下图所示:
(图示:状态空间模型 ↔\xleftrightarrow{} 脉冲响应 ↔L,Z\xleftrightarrow{\mathcal{L},\mathcal{Z}}L,Z 传递函数)
补充:各种变换定义及其性质
好的,我们来系统地讲解信号与系统分析中最重要的三大变换:傅里叶变换、拉普拉斯变换和Z变换。我会清晰地阐述它们的定义、联系、区别和应用场景。
核心思想:变换域分析
核心思想: 这三大变换的本质都是一种数学工具,目的是将信号从时域 (Time Domain) 转换到另一个域 (Domain)(频域、复频域)进行分析。在时域中,我们分析信号如何随时间变化;在变换域中,我们分析信号的“成分”,比如包含哪些频率,这些成分的幅度和相位如何。这就像用一个棱镜将白光分解为七彩光谱。
为什么需要变换? 因为很多在时域中复杂难解的操作(如微分、积分、卷积),在变换域中会简化为简单的代数运算(如乘法、除法),极大地简化了系统分析和设计。
1. 傅里叶变换 (Fourier Transform, FT)
1.1 定义与思想
- 核心问题: 一个信号是由哪些不同频率、不同振幅的正弦波“叠加”而成的?
- 数学定义 (连续时间):
对于一个连续时间信号 ( x(t) ),其傅里叶变换 ( X(j\omega) ) 为:
[
X(j\omega) = \int_{-\infty}^{\infty} x(t) e^{-j\omega t} dt
]
其中,( \omega = 2\pi f ) 是角频率 (Angular Frequency),单位是弧度/秒 (rad/s)。( j ) 是虚数单位。( X(j\omega) ) 是一个复数,包含了每个频率分量 ( \omega ) 的幅度和相位信息。 - 逆傅里叶变换 (Inverse Fourier Transform, IFT): 可以从频域恢复回时域:
[
x(t) = \frac{1}{2\pi} \int_{-\infty}^{\infty} X(j\omega) e^{j\omega t} d\omega
]
1.2 特点与应用
- 关注点: 纯粹的频率分析。它只关心信号的频率成分,不关心信号何时开始。
- 收敛条件 (Dirichlet条件): 信号必须满足绝对可积,即 ( \int_{-\infty}^{\infty} |x(t)| dt < \infty )。这意味着很多重要信号(如单位阶跃信号 ( u(t) )、增长的指数信号 ( e^{at} (a>0) ))的傅里叶变换不存在,这是FT的一个主要局限性。
- 主要应用:
- 信号频谱分析 (Spectrum Analysis)。
- 滤波器的分析与设计。
- 处理平稳信号 (信号特性不随时间改变)。
1.3 离散对应:离散时间傅里叶变换 (Discrete-Time Fourier Transform, DTFT)
对于离散时间信号 ( x[n] ),其DTFT为:
[
X(e^{j\omega}) = \sum_{n=-\infty}^{\infty} x[n] e^{-j\omega n}
]
其频谱 ( X(e^{j\omega}) ) 是周期为 ( 2\pi ) 的连续函数。
2. 拉普拉斯变换 (Laplace Transform)
2.1 定义与思想 (对FT的推广)
- 核心问题: 如何让那些不满足绝对可积条件的信号(尤其是不稳定信号)也能进行变换域分析?同时,如何更方便地分析系统的稳定性?
- 数学定义 (连续时间):
在FT的积分核 ( e^{-j\omega t} ) 上乘以一个衰减因子 ( e^{-\sigma t} ),构成新的复指数核 ( e^{-s t} ),其中 ( s = \sigma + j\omega ) 是一个复频率 (Complex Frequency) 变量。
拉普拉斯变换 ( X(s) ) 定义为:
[
X(s) = \int_{0}^{\infty} x(t) e^{-st} dt
]
(注:通常考虑因果信号,故积分从0开始,称为单边拉普拉斯变换 (Unilateral Laplace Transform))。
2.2 特点与应用
- 收敛域 (Region of Convergence, ROC): 拉普拉斯变换是否收敛,取决于 ( \sigma ) 的取值。ROC是s平面上使积分收敛的s值的集合。ROC是理解系统因果性和稳定性的关键。
- 与FT的关系:
- 拉普拉斯变换可以看作是更广义的傅里叶变换。
- 当 ( s = j\omega )(即复变量s的实部 ( \sigma = 0 ))时,拉普拉斯变换就退化为傅里叶变换。但前提是 ( j\omega ) 轴位于ROC内。
- 主要应用:
- 求解微分方程: 将时域的微分运算转换为s域的代数运算。
- 分析线性时不变系统 (LTI System) 的稳定性: 系统稳定的充要条件是其所有极点 (Poles) 的实部都小于零(即极点都位于s平面的左半平面)。
- 是连续时间系统分析和综合的主要工具。
3. Z变换 (z-Transform)
3.1 定义与思想 (离散时间的拉普拉斯变换)
- 核心问题: 如何为离散时间系统建立一个类似于拉普拉斯变换的强大分析工具?
- 数学定义:
对于一个离散时间信号 ( x[n] ),其Z变换 ( X(z) ) 定义为:
[
X(z) = \sum_{n=-\infty}^{\infty} x[n] z^{-n}
]
其中,( z = re^{j\omega} ) 是一个复变量。
3.2 特点与应用
- 与拉普拉斯变换的关系:
- Z变换本质上是离散时间版本的拉普拉斯变换。
- 通过映射 ( z = e^{sT} )(T为采样周期)可以建立s平面和z平面的对应关系。
- 收敛域 (ROC): 与拉普拉斯变换类似,Z变换也有其ROC,是z平面上使级数收敛的z值的集合(通常是一个圆环区域)。ROC对判断离散系统的因果性和稳定性至关重要。
- 与DTFT的关系:
- 当 ( |z| = 1 )(即z在复平面的单位圆上)时,Z变换就退化为离散时间傅里叶变换 (DTFT)。
- 主要应用:
- 求解差分方程: 将时域的差分运算转换为z域的代数运算。
- 分析离散LTI系统(尤其是数字滤波器)的稳定性: 系统稳定的充要条件是所有极点都位于z平面的单位圆内。
- 是数字信号处理 (Digital Signal Processing, DSP) 和离散系统分析的基石。
三者的关系总结与对比
特性 | 傅里叶变换 (FT) | 拉普拉斯变换 (LT) | Z变换 (ZT) |
---|---|---|---|
分析对象 | 连续时间信号 ( x(t) ) | 连续时间信号 ( x(t) ) | 离散时间信号 ( x[n] ) |
变换域变量 | 实频率 ( j\omega ) (虚轴) | 复频率 ( s = \sigma + j\omega ) (整个s平面) | 复变量 ( z = re^{j\omega} ) (整个z平面) |
收敛性 | 要求严格(绝对可积) | 要求宽松,有收敛域(ROC) | 要求宽松,有收敛域(ROC) |
与FT的关系 | - | FT是LT在 ( s = j\omega ) 轴上的特例 | DTFT是ZT在单位圆 ( |
核心应用 | 频谱分析、滤波 | 求解微分方程、连续系统稳定性分析 | 求解差分方程、离散系统稳定性分析 |
系统稳定性 | (间接) | 极点全部在s左半平面 | 极点全部在z单位圆内 |