秩 秩的定义 在线性代数中,一个矩阵 A A A 的列秩是列向量生成的最大线性无关组的向量个数。类似地,行秩是 A A A 的线性无关的横行的个数。矩阵的列秩与行秩总是相等的,因此它们可以简单地称作矩阵 A A A 的秩,通常表示为 r ( A ) , rank ( A ) , rk ( A ) \text{r}(A), \text{rank}(A), \text{rk}(A) r ( A ) , rank ( A ) , rk ( A ) 。
rank ( A ) \text{rank}(A) rank ( A ) 为 A A A 的列空间的维数,i.e. dim span { a 1 , ⋯ , a n } \dim\text{span }\{a_1, \cdots, a_n\} dim span { a 1 , ⋯ , a n } 。
可替代定义 用行列式定义 设 A A A 为 m × n m\times n m × n 矩阵。若 A A A 至少有一个 r r r 阶非零子式,而其所有 r + 1 r+1 r + 1 阶子式全为零,即矩阵的最高阶非零子式的阶数为 r r r 。则称 r r r 为 A A A 的秩。
用线性映射定义 考虑线性映射:
f A : F n → F m , x ↦ A ⋅ x \begin{aligned} &f_A: F^n \rightarrow F^m,\\ &x \mapsto A\cdot x \end{aligned} f A : F n → F m , x ↦ A ⋅ x
对于每个矩阵 A A A ,f A f_A f A 都是一个线性映射,同时,对每个 F n → F m F^n\rightarrow F^m F n → F m 的线性映射 f f f ,都存在矩阵 A A A 使得 f = f A f=f_A f = f A 。也就是,映射
Φ : M n ( K ) → L ( F n , F m ) A ↦ f A \begin{aligned} &\Phi: \mathcal{M}_n(\mathbb{K})\rightarrow \mathcal{L}(F^n, F^m)\\ &A\mapsto f_A \end{aligned} Φ : M n ( K ) → L ( F n , F m ) A ↦ f A
是一个同构映射。所以一个矩阵 A A A 的秩还可定义为 f A f_A f A 的像的维度(Dim of Image,参见线性映射:核、像与秩-零化度理论 )。
矩阵 A A A 成为 f A f_A f A 的变换矩阵。此定义的好处是适用于任何线性映射而不需指定矩阵,因为每个线性映射有且仅有一个矩阵与其对应。
行秩列秩相等性 基本证明思路: 矩阵可以看作线性映射的变换矩阵,列秩为像空间的维度,行秩为非零原像空间的维度,因此列秩与行秩相等,即像空间的维度与非零原像空间的维度相等(这可以从矩阵的奇异值分解看出来)。
column rank = dim Image ( A ) = dim { A x : x ∈ R n } \text{column rank} = \dim \text{Image}(A) = \dim \{Ax: x\in \mathbb{R}^{n}\} column rank = dim Image ( A ) = dim { A x : x ∈ R n } .row rank = dim { x ∈ R n : A x ≠ 0 } \text{row rank} = \dim \{x\in\mathbb{R}^{n} : Ax\neq 0\} row rank = dim { x ∈ R n : A x = 0 } .证明一:线性组合 适用于标量域上的矩阵,实数域或复数域皆可。
令 A A A 是一个 m × n m\times n m × n 的矩阵,其列秩为 r r r 。因此矩阵 A A A 的列空间的维度是 r r r 。令 c 1 , c 2 , ⋯ , c r c_1, c_2, \cdots, c_r c 1 , c 2 , ⋯ , c r 是 A A A 的列空间的一组基,构成 m × r m\times r m × r 矩阵 C = [ c 1 , c 2 , ⋯ , c r ] C = [c_1, c_2, \cdots, c_r] C = [ c 1 , c 2 , ⋯ , c r ] 。则 A A A 可以写为 A = [ a 1 , ⋯ , a n ] = [ c 1 , ⋯ , c r ] [ t 11 ⋯ t 1 n ⋮ ⋱ ⋮ t r 1 ⋯ t r n ] ≜ C T A = [a_1, \cdots, a_n] = [c_1, \cdots, c_r]\begin{bmatrix}t_{11}& \cdots& t_{1n}\\ \vdots& \ddots& \vdots\\ t_{r1}& \cdots& t_{rn}\end{bmatrix}\triangleq CT A = [ a 1 , ⋯ , a n ] = [ c 1 , ⋯ , c r ] t 11 ⋮ t r 1 ⋯ ⋱ ⋯ t 1 n ⋮ t r n ≜ CT 。
现在,由于 A = C T A = CT A = CT ,A A A 的每个行向量是 T T T 的行向量的线性组合,这意味着 A A A 的行向量空间包含于 T T T 的行向量空间,因此 A A A 的行秩 ≤ T \leq T ≤ T 的行秩。但 T T T 仅有 r r r 行,故 T T T 的行秩 ≤ r = A \leq r = A ≤ r = A 的列秩。这就证明了 A A A 的行秩 ≤ A \leq A ≤ A 的列秩。
考虑 A A A 的转置矩阵 A T A^T A T ,则 A A A 的列秩 = A T A^T A T 的行秩 ≤ A T \leq A^T ≤ A T 的列秩 = A A A 的行秩。证毕。
证明二:正交性 适用于内积空间,实数域或复数域皆可。
令 A A A 是一个 m × n m\times n m × n 的矩阵,其行秩为 r r r 。因此 A A A 的行向量空间的维度是 r r r ,设 x 1 , ⋯ , x r x_1, \cdots, x_r x 1 , ⋯ , x r 是 A A A 的行向量空间的一组基,如果把这组基当作列向量集看待,则向量集 { A x 1 , ⋯ , A x r } \{Ax_1, \cdots, Ax_r\} { A x 1 , ⋯ , A x r } 是线性独立的。
这是因为,对一组标量系数 c 1 , ⋯ , c r c_1, \cdots, c_r c 1 , ⋯ , c r ,如果
c 1 A x 1 + ⋯ + c r A x r = A ( c 1 x 1 + ⋯ + c r x r ) = A v = 0 , c_1 Ax_1 + \cdots + c_rAx_r = A(c_1x_1+\cdots+c_rx_r) = Av = 0, c 1 A x 1 + ⋯ + c r A x r = A ( c 1 x 1 + ⋯ + c r x r ) = A v = 0 ,
其中 v = c 1 x 1 + ⋯ + c r x r v = c_1x_1+\cdots+c_rx_r v = c 1 x 1 + ⋯ + c r x r 。则可以推出两个事实:(1)v v v 是 A A A 行向量空间的线性组合,即 v v v 属于 A A A 的行向量空间;(2)由于 A v = 0 Av=0 A v = 0 ,则v v v 正交于 A A A 的任意一个行向量,从而正交于 A A A 的行向量空间的所有向量。 上述两点结合,则 v v v 正交于自身,这意味着 v = 0 v=0 v = 0 ,即 c 1 x 1 + ⋯ + c r x r = 0 c_1x_1+\cdots+c_rx_r = 0 c 1 x 1 + ⋯ + c r x r = 0 ,又由于 x 1 , ⋯ , x r x_1, \cdots, x_r x 1 , ⋯ , x r 是一组基,可知 c 1 = ⋯ = c r = 0 c_1 = \cdots = c_r = 0 c 1 = ⋯ = c r = 0 ,故 { A x 1 , ⋯ , A x r } \{Ax_1, \cdots, Ax_r\} { A x 1 , ⋯ , A x r } 是线性独立的。
A x i Ax_i A x i 是 A A A 的列空间中的向量。因此 { A x 1 , ⋯ , A x r } \{Ax_1, \cdots, Ax_r\} { A x 1 , ⋯ , A x r } 是 A A A 的列空间中 r r r 个线性独立的向量。所以 A A A 的列向量空间的维数(A A A 的列秩)≥ r = A \geq r = A ≥ r = A 的行秩。
考虑 A A A 的转置矩阵 A T A^T A T ,则 A A A 的行秩 = A T A^T A T 的列秩 ≥ A T \geq A^T ≥ A T 的行秩 = A A A 的列秩。证毕。
证明三 令 A A A 是一个 m × n m\times n m × n 矩阵,定义 rk ( A ) \text{rk}(A) rk ( A ) 为 A A A 的列秩,A ∗ A^* A ∗ 是 A A A 的共轭转置。
首先我们有 A ∗ A x = 0 ⟺ A x = 0 A^*Ax = 0 \Longleftrightarrow Ax = 0 A ∗ A x = 0 ⟺ A x = 0 。
⟹ : A ∗ A x = 0 ⟹ x ∗ A ∗ A x = 0 ⟹ ( A x ) ∗ ( A x ) = 0 ⟹ ∥ A x ∥ 2 2 = 0 ⟹ A x = 0 \Longrightarrow: A^*Ax = 0 \Longrightarrow x^*A^*Ax = 0 \Longrightarrow (Ax)^*(Ax) = 0 \Longrightarrow \|Ax\|_2^2 = 0 \Longrightarrow Ax = 0 ⟹: A ∗ A x = 0 ⟹ x ∗ A ∗ A x = 0 ⟹ ( A x ) ∗ ( A x ) = 0 ⟹ ∥ A x ∥ 2 2 = 0 ⟹ A x = 0 ;⟸ \Longleftarrow ⟸ 是显然的。
这说明 A A A 与 A ∗ A A^* A A ∗ A 的零空间相同。由秩-零化度定理 (像空间维度+零空间维度=列向量个数,其中像空间维度即为列秩),可得 rk ( A ) = rk ( A ∗ A ) \text{rk}(A) = \text{rk}(A^*A) rk ( A ) = rk ( A ∗ A ) 。
而 A ∗ A A^*A A ∗ A 的每一个列向量是 A ∗ A^* A ∗ 的列向量的线性组合,则 A ∗ A A^*A A ∗ A 的列向量空间包含于 A ∗ A^* A ∗ 的列向量空间,故 rk ( A ∗ A ) ≤ rk ( A ∗ ) \text{rk}(A^*A)\leq \text{rk}(A^*) rk ( A ∗ A ) ≤ rk ( A ∗ ) 。进而 rk ( A ) = rk ( A ∗ A ) ≤ rk ( A ∗ ) \text{rk}(A) = \text{rk}(A^*A)\leq \text{rk}(A^*) rk ( A ) = rk ( A ∗ A ) ≤ rk ( A ∗ ) 。
应用这一结果于 A ∗ A^* A ∗ ,则 rk ( A ∗ ) = rk ( A A ∗ ) ≤ rk ( A ) \text{rk}(A^*) = \text{rk}(AA^*) \leq \text{rk}(A) rk ( A ∗ ) = rk ( A A ∗ ) ≤ rk ( A ) ,则 A A A 与 A ∗ A^* A ∗ 的列秩相等,后者即为 A A A 的行秩。证毕。
秩-零化度定理(Rank-nullity theorem) 此定理给出了一个线性变换或一个矩阵的秩与它的零化度之间的关系。
零化度:对矩阵而言,零化度是其零空间的维数;对线性变换而言,零化度是其核空间的维数。
对于一个元素在域 F F F 的 m × n m\times n m × n 矩阵 A A A ,
rank A + nullity A = n . \text{rank}\;A + \text{nullity}\;A = n. rank A + nullity A = n .
对于一个从 F − F- F − 线性空间 V V V 映射到 F − F- F − 线性空间 W W W 的线性变换 T : V ↦ W T:V\mapsto W T : V ↦ W ,我们有
dim ( Im T ) + dim ( Ker T ) = rank T + nullity T = dim V \dim(\text{Im}\;T) + \dim(\text{Ker}\;T) = \text{rank}\;T + \text{nullity}\;T = \dim V dim ( Im T ) + dim ( Ker T ) = rank T + nullity T = dim V
秩的不等式 rank ( A B ) ≤ min { rank ( A ) , rank ( B ) } \text{rank}(AB) \leq \min \{\text{rank}(A),\text{rank}(B)\} rank ( A B ) ≤ min { rank ( A ) , rank ( B )}
A B AB A B 的每一个列向量是 A A A 的列向量的线性组合,则 A B AB A B 的列向量空间包含于 A A A 的列向量空间,故 rank ( A B ) ≤ rank ( A ) \text{rank}(AB)\leq \text{rank}(A) rank ( A B ) ≤ rank ( A ) 。A B AB A B 的每一个行向量是 B B B 的行向量的线性组合,则 A B AB A B 的行向量空间包含于 B B B 的行向量空间,故 rank ( A B ) ≤ rank ( B ) \text{rank}(AB)\leq \text{rank}(B) rank ( A B ) ≤ rank ( B ) 。
rank ( A + B ) ≤ rank ( A ) + rank ( B ) \text{rank} (A+B) \leq \text{rank}(A) + \text{rank}(B) rank ( A + B ) ≤ rank ( A ) + rank ( B )
知乎汇总