Schur 分解
1. 定理
设T∈Cn×n 被划分如下,
T=[T110T12T22],
则λ(T)=λ(T11)∪λ(T22),其中 λ(⋅) 是指谱集,即特征值的集合。
证明
假设存在 x=0 使得Tx=[T110T12T22][x1x2]=λ[x1x2]。
- 如果x2=0,则T22x2=λx2,这意味着λ∈λ(T22)。
- 如果x2=0,则T11x1=λx1,这意味着λ∈λ(T11)。
因此λ(T)⊂λ(T11)∪λ(T22)。λ(T11)∪λ(T22)⊂λ(T) 是显然的,则λ(T)=λ(T11)∪λ(T22)。 ■
设 A∈Cn×n,B∈Cp×p 和 X∈Cn×p 且 rank(X)=p 满足
AX=XB,
则存在一个酉矩阵 U∈Cn×n 使得
UHAU=T=[T110T12T22]
其中 T11∈Cp×p 和 T22∈C(n−p)×(n−p),且 λ(T11)=λ(A)∩λ(B)。
证明
设 X=U[R10],U∈Cn×n,R1∈Cp×p 是非奇异的。
则
⟹AU[R10]=U[R10]B,[T11T21T12T22][R10]=[R1B0],
其中 T:=[T11T21T12T22]=UHAU。
由于 R1 是非奇异的且 T21R1=0,则 T21=0。
由于 T11R1=R1B 且 R1 是非奇异的,则 λ(T11)=λ(B)。又因为 A=UTUH 且T21=0,则 λ(A)=λ(T)=λ(T11)∪λ(T22),这意味着 λ(A)∩λ(B)=λ(T11)。 ■
(Schur 分解) 如果 A∈Cn×n,则存在一个酉矩阵 Q∈Cn×n 使得 QHAQ=T:=D+N,其中 D=diag(λ1,⋯,λn) 且 N 是严格上三角的。
证明
当n=1 时,结论自然成立。
假设对于所有 n−1 阶矩阵结论成立。如果 Ax=λx 且 x=0,由 Lemma 1.2(令 λ 为 Lemma 1.2 中的 B∈C1×1 ),则存在一个酉矩阵 U 使得
UHAU=[λ0wHC].
通过归纳,存在一个酉矩阵 U~ 使得 U~HCU~ 是上三角的。
因此,令 Q=U⋅diag(1,U~),则 QHAQ 是上三角的。 ■
如果 Q=[q1,⋯,qn],则 qi 被称为 Schur 向量。由 AQ=QT,我们有
Aqk=λkqk+i=1∑k−1nikqi,k=1:n.
由此,我们可以得出子空间
Sk=span{q1,⋯,qk},k=1:n
对于 A 是不变的(即 ∀x∈Sk,Ax∈Sk)。此外,如果 Qk=[q1,⋯,qk],则 λ(QkHAQk)={λ1,⋯,λk}。
2. 应用
正规矩阵
如果AHA=AAH,则A 是正规的。
A∈Cn×n 是正规的⟺ 存在一个酉矩阵 Q∈Cn×n 使得 QHAQ=diag(λ1,⋯,λn)。
证明
⟸:
设 D=diag(λ1,⋯,λn),则 AHA=QDHQHQDQH=QDHDQH 且 AAH=QDDHQH。由于 DHD=DDH,则 AHA=AAH。
⟹:
如果A 是正规的,设 T=QHAQ,其中 Q 是 Schur 分解中的酉矩阵,则 THT=TTH,这意味着 T 是正规的。
由于 T 是上三角的,我们有
t11⋮t1n⋱⋯tnnt11⋯⋱t1n⋮tnn=t11⋯⋱t1n⋮tnnt11⋮t1n⋱⋯tnn
对于 (1,1) 位置,我们有
LHS=∣t11∣2=k=1∑n∣t1k∣2=RHS,
这意味着 t1k=0,k=2:n,然后对于 (2,2) 位置,我们有
LHS=∣t12∣2+∣t22∣2=∣t22∣2=k=2∑n∣t2k∣2=RHS,
这意味着 t2k=0,k=3:n。如上所述,最终我们可以得出 T=diag(t11,⋯,tnn)。 ■