【分析学】Hilbert 空间的分离性
目录
- Riesz 表示定理
- 凸集投影定理
- Hilbert 空间中凸集分离定理的证明
- 情况 1:
- 情况 2:
Riesz 表示定理
- Riesz 表示定理:希尔伯特空间 HHH 上任意连续线性泛函 fff 可表示为 f(x)=⟨x,y⟩f(x) = \langle x, y \ranglef(x)=⟨x,y⟩(y∈Hy \in Hy∈H)
线性泛函: f(αx+βy)=αf(x)+βf(y),x,y∈H,α,β∈Kf(\alpha x+\beta y)= \alpha f(x)+\beta f(y), x,y\in H, \alpha, \beta\in \mathbb{K}f(αx+βy)=αf(x)+βf(y),x,y∈H,α,β∈K.
证明:
步骤 1:若 f=0f = 0f=0,取 y=0y = 0y=0。 显然成立。
步骤 2:假设 f≠0f \neq 0f=0,构造 yyy。 由于 fff 是连续线性泛函,其核空间 ker(f)={x∈H∣f(x)=0}\ker(f) = \{ x \in H \mid f(x) = 0 \}ker(f)={x∈H∣f(x)=0} 是 HHH 的闭子空间(因为 fff 连续)。 由于 f≠0f \neq 0f=0,存在 z∈Hz \in Hz∈H 使得 f(z)≠0f(z) \neq 0f(z)=0。我们可以分解 HHH 为:
H=ker(f)⊕ker(f)⊥,H = \ker(f) \oplus \ker(f)^\perp, H=ker(f)⊕ker(f)⊥,
其中 ker(f)⊥\ker(f)^\perpker(f)⊥ 是 ker(f)\ker(f)ker(f) 的正交补空间。
步骤 3:选取 yyy 的方向。 由于 ker(f)⊥\ker(f)^\perpker(f)⊥ 是一维的(因为 ker(f)\ker(f)ker(f) 的余维数为 1),我们可以选择一个单位向量 e∈ker(f)⊥e \in \ker(f)^\perpe∈ker(f)⊥,使得 ker(f)⊥=span{e}\ker(f)^\perp = \text{span}\{e\}ker(f)⊥=span{e}。 定义:
y=f(e)‾e,y = \overline{f(e)} e, y=f(e)e,
其中 f(e)‾\overline{f(e)}f(e) 是 f(e)f(e)f(e) 的复共轭(若 HHH 是实空间,则直接取 y=f(e)ey = f(e) ey=f(e)e)。
步骤 4:验证 f(x)=⟨x,y⟩f(x) = \langle x, y \ranglef(x)=⟨x,y⟩。 对任意 x∈Hx \in Hx∈H,可以唯一分解为:
x=x0+αe,x0∈ker(f),α∈C.x = x_0 + \alpha e, \quad x_0 \in \ker(f), \alpha \in \mathbb{C}. x=x0+αe,x0∈ker(f),α∈C.
计算:
f(x)=f(x0+αe)=f(x0)+αf(e)=αf(e),f(x) = f(x_0 + \alpha e) = f(x_0) + \alpha f(e) = \alpha f(e), f(x)=f(x0+αe)=f(x0)+αf(e)=αf(e),
因为 x0∈ker(f)x_0 \in \ker(f)x0∈ker(f)。
另一方面,
⟨x,y⟩=⟨x0+αe,f(e)‾e⟩=αf(e)⟨e,e⟩=αf(e),\langle x, y \rangle = \langle x_0 + \alpha e, \overline{f(e)} e \rangle = \alpha f(e) \langle e, e \rangle = \alpha f(e), ⟨x,y⟩=⟨x0+αe,f(e)e⟩=αf(e)⟨e,e⟩=αf(e),
因为 x0⊥ex_0 \perp ex0⊥e。
因此,f(x)=⟨x,y⟩f(x) = \langle x, y \ranglef(x)=⟨x,y⟩。
凸集投影定理
投影定理:设 HHH 是 Hilbert 空间,C⊆HC \subseteq HC⊆H 是非空闭凸子集。则对任意 x∈Hx \in Hx∈H,存在唯一的 y∈Cy \in Cy∈C 使得:
∥x−y∥=infz∈C∥x−z∥.\|x - y\| = \inf_{z \in C} \|x - z\|. ∥x−y∥=z∈Cinf∥x−z∥.
此 yyy 称为 xxx 在 CCC 上的投影,记作 y=PC(x)y = P_C(x)y=PC(x).
证明
证明分两步:存在性和唯一性。
1. 存在性
设 d=infz∈C∥x−z∥d = \inf_{z \in C} \|x - z\|d=infz∈C∥x−z∥(d≥0d \geq 0d≥0)。由下确界定义,存在序列 {yn}⊆C\{y_n\} \subseteq C{yn}⊆C 使得:
limn→∞∥x−yn∥=d.\lim_{n \to \infty} \|x - y_n\| = d. n→∞lim∥x−yn∥=d.
需证 {yn}\{y_n\}{yn} 是 Cauchy 列,从而收敛于某 y∈Cy \in Cy∈C,且 ∥x−y∥=d\|x - y\| = d∥x−y∥=d.
Hilbert 空间的平行四边形法则:
∥u+v∥2+∥u−v∥2=2(∥u∥2+∥v∥2),∀u,v∈H.\|u + v\|^2 + \|u - v\|^2 = 2(\|u\|^2 + \|v\|^2), \quad \forall u, v \in H. ∥u+v∥2+∥u−v∥2=2(∥u∥2+∥v∥2),∀u,v∈H.
取 u=x−ymu = x - y_mu=x−ym, v=x−ynv = x - y_nv=x−yn,代入得:
∥(x−ym)+(x−yn)∥2+∥(x−ym)−(x−yn)∥2=2(∥x−ym∥2+∥x−yn∥2),\|(x - y_m) + (x - y_n)\|^2 + \|(x - y_m) - (x - y_n)\|^2 = 2(\|x - y_m\|^2 + \|x - y_n\|^2), ∥(x−ym)+(x−yn)∥2+∥(x−ym)−(x−yn)∥2=2(∥x−ym∥2+∥x−yn∥2),
即:
∥2x−(ym+yn)∥2+∥yn−ym∥2=2(∥x−ym∥2+∥x−yn∥2).\|2x - (y_m + y_n)\|^2 + \|y_n - y_m\|^2 = 2(\|x - y_m\|^2 + \|x - y_n\|^2). ∥2x−(ym+yn)∥2+∥yn−ym∥2=2(∥x−ym∥2+∥x−yn∥2).
整理得:
∥yn−ym∥2=2(∥x−ym∥2+∥x−yn∥2)−∥2x−(ym+yn)∥2.(∗)\|y_n - y_m\|^2 = 2(\|x - y_m\|^2 + \|x - y_n\|^2) - \|2x - (y_m + y_n)\|^2. \quad (*) ∥yn−ym∥2=2(∥x−ym∥2+∥x−yn∥2)−∥2x−(ym+yn)∥2.(∗)
由于 CCC 是凸集,ym+yn2∈C\frac{y_m + y_n}{2} \in C2ym+yn∈C,故:
∥x−ym+yn2∥≥d⟹∥2x−(ym+yn)∥≥2d.\left\| x - \frac{y_m + y_n}{2} \right\| \geq d \implies \|2x - (y_m + y_n)\| \geq 2d. x−2ym+yn≥d⟹∥2x−(ym+yn)∥≥2d.
代入 ((*)):
∥yn−ym∥2≤2(∥x−ym∥2+∥x−yn∥2)−(2d)2.\|y_n - y_m\|^2 \leq 2(\|x - y_m\|^2 + \|x - y_n\|^2) - (2d)^2. ∥yn−ym∥2≤2(∥x−ym∥2+∥x−yn∥2)−(2d)2.
当 m,n→∞m, n \to \inftym,n→∞ 时,∥x−ym∥→d\|x - y_m\| \to d∥x−ym∥→d, ∥x−yn∥→d\|x - y_n\| \to d∥x−yn∥→d,故:
lim supm,n→∞∥yn−ym∥2≤2(d2+d2)−4d2=0.\limsup_{m,n \to \infty} \|y_n - y_m\|^2 \leq 2(d^2 + d^2) - 4d^2 = 0. m,n→∞limsup∥yn−ym∥2≤2(d2+d2)−4d2=0.
因此 {yn}\{y_n\}{yn} 是 Cauchy 列。因 HHH 完备,存在 y∈Hy \in Hy∈H 使得 yn→yy_n \to yyn→y。又因 CCC 闭,y∈Cy \in Cy∈C。由范数连续性:
∥x−y∥=limn→∞∥x−yn∥=d.\|x - y\| = \lim_{n \to \infty} \|x - y_n\| = d. ∥x−y∥=n→∞lim∥x−yn∥=d.
故存在性得证。
2. 唯一性
假设存在 y1,y2∈Cy_1, y_2 \in Cy1,y2∈C 满足:
∥x−y1∥=∥x−y2∥=d.\|x - y_1\| = \|x - y_2\| = d. ∥x−y1∥=∥x−y2∥=d.
由平行四边形法则:
∥(x−y1)+(x−y2)∥2+∥(x−y1)−(x−y2)∥2=2(∥x−y1∥2+∥x−y2∥2),\|(x - y_1) + (x - y_2)\|^2 + \|(x - y_1) - (x - y_2)\|^2 = 2(\|x - y_1\|^2 + \|x - y_2\|^2), ∥(x−y1)+(x−y2)∥2+∥(x−y1)−(x−y2)∥2=2(∥x−y1∥2+∥x−y2∥2),
即:
∥2x−(y1+y2)∥2+∥y2−y1∥2=2(d2+d2)=4d2.\|2x - (y_1 + y_2)\|^2 + \|y_2 - y_1\|^2 = 2(d^2 + d^2) = 4d^2. ∥2x−(y1+y2)∥2+∥y2−y1∥2=2(d2+d2)=4d2.
因 CCC 凸,y1+y22∈C\frac{y_1 + y_2}{2} \in C2y1+y2∈C,故:
∥x−y1+y22∥≥d⟹∥2x−(y1+y2)∥≥2d.\left\| x - \frac{y_1 + y_2}{2} \right\| \geq d \implies \|2x - (y_1 + y_2)\| \geq 2d. x−2y1+y2≥d⟹∥2x−(y1+y2)∥≥2d.
代入上式:
(2d)2+∥y2−y1∥2≤4d2⟹∥y2−y1∥2≤0.(2d)^2 + \|y_2 - y_1\|^2 \leq 4d^2 \implies \|y_2 - y_1\|^2 \leq 0. (2d)2+∥y2−y1∥2≤4d2⟹∥y2−y1∥2≤0.
因此 ∥y2−y1∥=0\|y_2 - y_1\| = 0∥y2−y1∥=0,即 y1=y2y_1 = y_2y1=y2。唯一性得证。
Hilbert 空间中凸集分离定理的证明
设 HHH 是一个 Hilbert 空间(实或复),内积为 ⟨⋅,⋅⟩\langle \cdot, \cdot \rangle⟨⋅,⋅⟩,范数为 ∥⋅∥\|\cdot\|∥⋅∥。
情况 1:
AAA 是非空开凸集,BBB 是非空凸集,且 A∩B=∅A \cap B = \emptysetA∩B=∅, 则存在 s∈Hs\in Hs∈H, ⟨s,x−y⟩<0\langle s,x-y\rangle<0⟨s,x−y⟩<0, ∀x∈A\forall x\in A∀x∈A, ∀y∈B\forall y\in B∀y∈B.
证明:
考虑集合 C=A−B={a−b∣a∈A,b∈B}C = A - B = \{a - b \mid a \in A, b \in B\}C=A−B={a−b∣a∈A,b∈B}。由于 AAA 和 BBB 是凸集,CCC 也是凸集。又因 AAA 是开集,且平移是连续映射,CCC 是开集。由 A∩B=∅A \cap B = \emptysetA∩B=∅,有 0∉C0 \notin C0∈/C。
设 d=inf{∥z∥∣z∈C}d = \inf\{\|z\| \mid z \in C\}d=inf{∥z∥∣z∈C}。由于 CCC 是开集且 0∉C0 \notin C0∈/C,有 d>0d > 0d>0(若 d=0d = 0d=0,则存在序列 {zn}⊂C\{z_n\} \subset C{zn}⊂C 使得 ∥zn∥→0\|z_n\| \to 0∥zn∥→0,即 zn→0z_n \to 0zn→0,但 CCC 是开集,故 000 应为 CCC 的内点,矛盾)。令 K=C‾K = \overline{C}K=C(CCC 的闭包),则 KKK 是闭凸集(凸集的闭包仍凸)。由于 0∉C0 \notin C0∈/C 且 CCC 是开集,000 不是 CCC 的极限点(否则存在序列收敛到 000,导致 d=0d = 0d=0),故 0∉K0 \notin K0∈/K,且 d=inf{∥z∥∣z∈K}>0d = \inf\{\|z\| \mid z \in K\} > 0d=inf{∥z∥∣z∈K}>0.
由 Hilbert 空间的投影定理,存在唯一向量 p∈Kp \in Kp∈K 使得 ∥p∥=d>0\|p\| = d > 0∥p∥=d>0,且 ppp 是 000 到 KKK 的最佳逼近点。投影定理蕴含:对任意 z∈Kz \in Kz∈K,有 Re⟨z−p,p⟩≥0\operatorname{Re} \langle z - p, p \rangle \geq 0Re⟨z−p,p⟩≥0(在实 Hilbert 空间中,⟨z−p,p⟩≥0\langle z - p, p \rangle \geq 0⟨z−p,p⟩≥0)。展开得:
Re⟨z,p⟩−Re⟨p,p⟩≥0⟹Re⟨z,p⟩≥∥p∥2=d2>0.\operatorname{Re} \langle z, p \rangle - \operatorname{Re} \langle p, p \rangle \geq 0 \implies \operatorname{Re} \langle z, p \rangle \geq \|p\|^2 = d^2 > 0. Re⟨z,p⟩−Re⟨p,p⟩≥0⟹Re⟨z,p⟩≥∥p∥2=d2>0.
由于 C⊆KC \subseteq KC⊆K,对任意 z∈Cz \in Cz∈C,有 Re⟨z,p⟩≥d2>0\operatorname{Re} \langle z, p \rangle \geq d^2 > 0Re⟨z,p⟩≥d2>0.
定义连续线性泛函 f:H→Rf: H \to \mathbb{R}f:H→R 为 f(x)=Re⟨x,p⟩f(x) = \operatorname{Re} \langle x, p \ranglef(x)=Re⟨x,p⟩(由 Riesz 表示引理,此泛函连续)。对任意 a∈A,b∈Ba \in A, b \in Ba∈A,b∈B,有 a−b∈Ca - b \in Ca−b∈C,故:
f(a−b)=Re⟨a−b,p⟩≥d2>0⟹f(a)>f(b).f(a - b) = \operatorname{Re} \langle a - b, p \rangle \geq d^2 > 0 \implies f(a) > f(b). f(a−b)=Re⟨a−b,p⟩≥d2>0⟹f(a)>f(b).
令 β=supb∈Bf(b)\beta = \sup_{b \in B} f(b)β=supb∈Bf(b)(可能为 +∞+\infty+∞,但下证有限)。由 f(a)>f(b)f(a) > f(b)f(a)>f(b) 对所有 a∈A,b∈Ba \in A, b \in Ba∈A,b∈B 成立,有:
infa∈Af(a)≥supb∈Bf(b)+d2>supb∈Bf(b)=β.\inf_{a \in A} f(a) \geq \sup_{b \in B} f(b) + d^2 > \sup_{b \in B} f(b) = \beta. a∈Ainff(a)≥b∈Bsupf(b)+d2>b∈Bsupf(b)=β.
取常数 c=βc = \betac=β。则:
- 对任意 b∈Bb \in Bb∈B,有 f(b)≤cf(b) \leq cf(b)≤c。
- 对任意 a∈Aa \in Aa∈A,有 f(a)>cf(a) > cf(a)>c(因 f(a)>β=cf(a) > \beta = cf(a)>β=c)。
由于 AAA 是开集且 fff 连续,f(A)f(A)f(A) 是开集,故 f(a)>cf(a) > cf(a)>c 对所有 a∈Aa \in Aa∈A 成立是合理的。超平面 {x∈H∣f(x)=c}\{x \in H \mid f(x) = c\}{x∈H∣f(x)=c} 分离 AAA 和 BBB:AAA 位于严格半空间 {x∣f(x)>c}\{x \mid f(x) > c\}{x∣f(x)>c},BBB 位于半空间 {x∣f(x)≤c}\{x \mid f(x) \leq c\}{x∣f(x)≤c}。
情况 2:
AAA 是紧凸集,BBB 是闭凸集,且 A∩B=∅A \cap B = \emptysetA∩B=∅,则存在 s∈Hs\in Hs∈H, ⟨s,x−y⟩<0\langle s,x-y\rangle<0⟨s,x−y⟩<0, ∀x∈A\forall x\in A∀x∈A, ∀y∈B\forall y\in B∀y∈B.
证明:
考虑集合 C=A−B={a−b∣a∈A,b∈B}C = A - B = \{a - b \mid a \in A, b \in B\}C=A−B={a−b∣a∈A,b∈B}。由于 AAA 和 BBB 是凸集,CCC 是凸集。由 A∩B=∅A \cap B = \emptysetA∩B=∅,有 0∉C0 \notin C0∈/C。设 d=inf{∥a−b∥∣a∈A,b∈B}d = \inf\{\|a - b\| \mid a \in A, b \in B\}d=inf{∥a−b∥∣a∈A,b∈B}。因 AAA 紧、BBB 闭且不相交,有 d>0d > 0d>0(否则存在序列 {an}⊂A,{bn}⊂B\{a_n\} \subset A, \{b_n\} \subset B{an}⊂A,{bn}⊂B 使得 ∥an−bn∥→0\|a_n - b_n\| \to 0∥an−bn∥→0;由 AAA 紧,有子列 ank→a∈Aa_{n_k} \to a \in Aank→a∈A,则 bnk=ank−(ank−bnk)→ab_{n_k} = a_{n_k} - (a_{n_k} - b_{n_k}) \to abnk=ank−(ank−bnk)→a,由 BBB 闭得 a∈Ba \in Ba∈B,矛盾)。故 d=inf{∥z∥∣z∈C}>0d = \inf\{\|z\| \mid z \in C\} > 0d=inf{∥z∥∣z∈C}>0.
令 K=C‾K = \overline{C}K=C(CCC 的闭包),则 KKK 是闭凸集。若 0∈K0 \in K0∈K,则存在序列 {zn}⊂C\{z_n\} \subset C{zn}⊂C 使得 zn→0z_n \to 0zn→0,即 an−bn→0a_n - b_n \to 0an−bn→0(an∈A,bn∈Ba_n \in A, b_n \in Ban∈A,bn∈B)。由 AAA 紧,有子列 ank→a∈Aa_{n_k} \to a \in Aank→a∈A,则 bnk=ank−(ank−bnk)→ab_{n_k} = a_{n_k} - (a_{n_k} - b_{n_k}) \to abnk=ank−(ank−bnk)→a,由 BBB 闭得 a∈Ba \in Ba∈B,与 A∩B=∅A \cap B = \emptysetA∩B=∅ 矛盾。故 0∉K0 \notin K0∈/K,且 d=inf{∥z∥∣z∈K}>0d = \inf\{\|z\| \mid z \in K\} > 0d=inf{∥z∥∣z∈K}>0.
由投影定理,存在唯一向量 p∈Kp \in Kp∈K 使得 ∥p∥=d>0\|p\| = d > 0∥p∥=d>0,且对任意 z∈Kz \in Kz∈K,有 Re⟨z−p,p⟩≥0\operatorname{Re} \langle z - p, p \rangle \geq 0Re⟨z−p,p⟩≥0,即:
Re⟨z,p⟩≥∥p∥2=d2>0.\operatorname{Re} \langle z, p \rangle \geq \|p\|^2 = d^2 > 0. Re⟨z,p⟩≥∥p∥2=d2>0.
由于 C⊆KC \subseteq KC⊆K,对任意 z∈Cz \in Cz∈C,有 Re⟨z,p⟩≥d2>0\operatorname{Re} \langle z, p \rangle \geq d^2 > 0Re⟨z,p⟩≥d2>0.
定义连续线性泛函 f:H→Rf: H \to \mathbb{R}f:H→R 为 f(x)=Re⟨x,p⟩f(x) = \operatorname{Re} \langle x, p \ranglef(x)=Re⟨x,p⟩。对任意 a∈A,b∈Ba \in A, b \in Ba∈A,b∈B,有 a−b∈Ca - b \in Ca−b∈C,故:
f(a−b)=Re⟨a−b,p⟩≥d2>0⟹f(a)>f(b).f(a - b) = \operatorname{Re} \langle a - b, p \rangle \geq d^2 > 0 \implies f(a) > f(b). f(a−b)=Re⟨a−b,p⟩≥d2>0⟹f(a)>f(b).
令 α=infa∈Af(a)\alpha = \inf_{a \in A} f(a)α=infa∈Af(a), β=supb∈Bf(b)\beta = \sup_{b \in B} f(b)β=supb∈Bf(b)。由 f(a)>f(b)f(a) > f(b)f(a)>f(b) 对所有 a∈A,b∈Ba \in A, b \in Ba∈A,b∈B 成立,有 α≥β+d2β\alpha \geq \beta + d^2 \betaα≥β+d2β。因 AAA 紧且 fff 连续,fff 在 AAA 上取最小值,即存在 a0∈Aa_0 \in Aa0∈A 使得 f(a0)=αf(a_0) = \alphaf(a0)=α。取常数 c=βc = \betac=β。则:
- 对任意 b∈Bb \in Bb∈B,有 f(b)≤cf(b) \leq cf(b)≤c。
- 对任意 a∈Aa \in Aa∈A,有 f(a)≥α≥β+d2>β=cf(a) \geq \alpha \geq \beta + d^2 > \beta = cf(a)≥α≥β+d2>β=c,故 f(a)>cf(a) > cf(a)>c.
超平面 {x∈H∣f(x)=c}\{x \in H \mid f(x) = c\}{x∈H∣f(x)=c} 分离 AAA 和 BBB:AAA 位于严格半空间 {x∣f(x)>c}\{x \mid f(x) > c\}{x∣f(x)>c},BBB 位于半空间 {x∣f(x)≤c}\{x \mid f(x) \leq c\}{x∣f(x)≤c}。