Matrix Norm
1. 矩阵范数的定义与性质
设 A∈Cm×n,定义一个实值函数 ∥A∥,它满足以下三个条件:
非负性:当 A=O时,∥A∥>0;当 A=O时,∥A∥=0;
齐次性:∥αA∥=∣α∣∥A∥(α∈C);
三角不等式:∥A+B∥≤∥A∥+∥B∥(B∈Cm×n)。
则称 ∥A∥为 A的广义矩阵范数。
若对 Cm×n,Cn×l及 Cm×l上的同类广义矩阵范数 ∥⋅∥,还应满足下面一个条件:
- 相容性:∥AB∥≤∥A∥⋅∥B∥,B∈Rn×l。
则称 ∥A∥为 A 的矩阵范数。
对于 Cm×n上的矩阵范数 ∥⋅∥M和 Cm与 Cn上的同类向量范数 ∥⋅∥V,如果
∥Ax∥V≤∥A∥M∥x∥V(∀A∈Cm×n,∀x∈Cn)
则称矩阵范数 ∥⋅∥M与向量范数 ∥⋅∥V是相容的。
设 ∥⋅∥M 是 Cn×n 上的矩阵范数,任取 Cn 中的非零列向量 y,且固定 y,则函数
∥x∥V=∥xyH∥M(∀x∈Cn)
是 Cn 上的向量范数,且矩阵范数 ∥⋅∥M 与向量范数 ∥⋅∥V 相容。
证明
非负性:当 x=0 时,xyH=0,从而 ∥x∥V>0;当 x=0 时,xyH=O,从而 ∥x∥V=0。
齐次性:对任意 k∈C,有
∥kx∥V=∥kxyH∥M=∣k∣∥xyH∥M=∣k∣∥x∥V
三角不等式:对任意 x1,x2∈Cn,有
∥x1+x2∥V=∥(x1+x2)yH∥M=∥x1yH+x2yH∥M≤∥x1yH∥M+∥x2yH∥M=∥x1∥V+∥x2∥V
因此,∥x∥V 是 Cn 上的向量范数。当 A∈Cn×n,x∈Cn 时
∥Ax∥V=∥(Ax)yH∥M=∥A(xyH)∥M≤∥A∥M∥xyH∥M=∥A∥M∥x∥V
所以矩阵范数 ∥⋅∥M 与向量范数 ∥⋅∥V 相容。证毕。■
2. 具体范数
2.1 Frobenius 范数
∥A∥F=∑i,jaij2.
∥A∥F 有一特点,现以定理给出于下。
设 A∈Cm×n,且 P∈Cm×m与 Q∈Cn×n都是酉矩阵,则
∥PA∥F=∥A∥F=∥AQ∥F
即给 A左乘或右乘以酉矩阵后,其 ∥⋅∥F 值不变(在 A∈Rm×n时,P和 Q都是正交矩阵)。
证明 若记 A的第 j 列为 aj(j=1,2,⋯,n),则有
∥PA∥F2=∥P(a1,a2,⋯,an)∥F2=∥(Pa1,Pa2,⋯,Pan)∥F2=j=1∑n∥Paj∥22=j=1∑n∥aj∥22=∥A∥F2
即 ∥PA∥F=∥A∥F。于是
∥AQ∥F=∥(AQ)H∥F=QHAHF=∥AH∥F=∥A∥F
证毕。■
2.2 诱导范数
已知 Cm 和 Cn 上的同类向量范数 ∥⋅∥,设 A∈Cm×n,则函数
∥A∥=∥x∥=1max∥Ax∥
是 Cm×n 上的矩阵范数,且与已知的向量范数相容。
证明 由向量范数是其分量的连续函数的性质可知,对每一个矩阵 A 而言,这个最大值都是可以达到的,也就是说,能够找到这样的向量 x0,使得 ∥x0∥=1,而 ∥Ax0∥=∥A∥。
非负性:当 A=O 时,存在 x0∈Cn 满足 ∥x0∥=1,使得 Ax0=0,从而
∥A∥⩾∥Ax0∥>0.
当 A=O 时,∥A∥=max∥x∥=1∥Ox∥=0。
齐次性:设 α∈C,则有
∥αA∥=∥x∥=1max∥αAx∥=∣α∣∥x∥=1max∥Ax∥=∣α∣∥A∥.
三角不等式:设 B∈Cm×n,对于矩阵 A+B,存在 x1∈Cn 满足 ∥x1∥=1,使得
∥A+B∥=∥(A+B)x1∥,
于是
∥A+B∥=∥Ax1+Bx1∥⩽∥Ax1∥+∥Bx1∥⩽∥A∥+∥B∥.
下面证明,对于任意的 y∈Cn 及 A∈Cm×n,有
∥Ay∥⩽∥A∥∥y∥.
当 y=0 时,结论显然成立;当 y=0 时,令 y0=∥y∥1y,则
∥y0∥=1,且有∥Ay0∥⩽∥A∥,于是
∥Ay∥=∥A(∥y∥y0)∥=∥y∥∥Ay0∥⩽∥y∥∥A∥
即结论亦成立。
最后证明,对于任意的 A∈Cm×n 及 B∈Cn×l,有
∥AB∥⩽∥A∥∥B∥
对于矩阵 AB,存在 x2∈Cl 满足 ∥x2∥=1,使得
∥AB∥=∥(AB)x2∥
利用 ∥Ay∥⩽∥A∥∥y∥,可得
∥AB∥=∥A(Bx2)∥⩽∥A∥∥Bx2∥⩽∥A∥∥B∥∥x2∥=∥A∥∥B∥
即 ∥A∥ 是 A 的矩阵范数。证毕。■
设 A=(aij)m×n∈Cm×n,x=(ξ1,ξ2,…,ξn)T∈Cn,则从属于向量 x 的三种范数 ∥x∥1,∥x∥2,∥x∥∞ 的矩阵范数依次是:
(1) ∥A∥1=maxj∑i=1m∣aij∣;
(2) ∥A∥2=λ1,λ1 为 AHA 的最大特征值;
(3) ∥A∥∞=maxi∑j=1n∣aij∣。
通常称 ∥A∥1,∥A∥2 及 ∥A∥∞ 依次为列和范数,谱范数及行和范数。
证明
(1) 对于任意的 x∈Cn:∥x∥1=1,则
∥Ax∥1=i=1∑mj=1∑naijξj≤i=1∑mj=1∑n∣aij∣∣ξj∣=(jmaxi=1∑m∣aij∣)j=1∑n∣ξj∣=jmaxi=1∑m∣aij∣,
因此有
∥A∥1=∥x∥1=1max∥Ax∥1⩽jmaxi=1∑m∣aij∣.
选取 k 使得
i=1∑m∣aik∣=jmaxi=1∑m∣aij∣.
则 Aek=(a1k,a2k,…,amk)T,且
∥A∥1=∥x∥1=1max∥Ax∥1⩾∥Aek∥1=i=1∑m∣aik∣=jmaxi=1∑m∣aij∣
因此(1)式成立。
(2) 因为 AHA 是 Hermite 矩阵,且由
xH(AHA)x=(Ax)H(Ax)=∥Ax∥22≥0
知 AHA 是半正定的,从而它的特征值都是非负实数,设为 λ1≥λ2≥…≥λn≥0。由于 AHA 是 Hermite 矩阵,因此它具有 n 个互相正交的且 L2 范数为 1 的特征向量 x1,x2,…,xn,并设它们依次属于特征值 λ1,λ2,…,λn。于是,任何一个范数 ∥x∥2=1 的向量 x,可以用这些特征向量线性表示,即有
x=t1x1+t2x2+…+tnxn,
由于
AHAx=i=1∑nti(AHAxi)=i=1∑nλitixi,
因此有
∥Ax∥22=(x,AHAx)=(i=1∑ntixi,i=1∑nλitixi)=i=1∑nλi∣ti∣2≤λ1i=1∑n∣ti∣2=λ1
从而有
∥A∥2=∥x∥2=1max∥Ax∥2≤λi.
另一方面,由于 ∥x1∥2=1,而且 ∥Ax1∥22=λ1,所以 ∥A∥2=max∥x∥2=1∥Ax∥2≥λ1,因此(2)式成立。
(3) 设 ∥x∥∞=1,则
∥Ax∥∞=imax∣j=1∑naijξj∣⩽imaxj=1∑n∣aij∣∣ξj∣⩽imaxj=1∑n∣aij∣
从而有 ∥A∥∞=max∥x∥∞=1∥Ax∥∞⩽maxi∑j=1n∣aij∣。
选取 k,使得
j=1∑n∣akj∣=imaxj=1∑n∣aij∣
y=η1⋮ηn,ηj=sign(akj).
则有 ∥y∥∞=1,且
Ay=(∗,⋯,∗,j=1∑n∣akj∣,∗,⋯,∗)T
从而
∥A∥∞=∥x∥∞=1max∥Ax∥∞⩾∥Ay∥∞⩾j=1∑n∣akj∣=imaxj=1∑n∣aij∣.
从而(3)式成立。证毕。■