方阵的特征值与特征向量
特征值与特征多项式
对于 n 阶方阵 A=(aij) ,把含有字母 λ 的方阵
λI−A=λ−a11−a12⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−ann
称为 A 的特征矩阵(Eigenmatrix)。
行列式 ∣λI−A∣ 的值表达式 ψ(λ) 是一个多项式,称为 A 的特征多项式(Characteristic polynomial),特征多项式的根称为 A 的特征值(Eigenvalue) 或特征根。
如果 λ0 是特征多项式的单根,则称 λ0 为单特征值,否则称为重特征值。
为了研究特征多项式的性质,我们将行列式的完整形式写出:
ψ(λ)=λ−a11−a12⋮−an1−a12λ−a22⋮−an2⋯⋯⋯−a1n−a2n⋮λ−ann
由行列式的排列计算法可知, ψ(λ) 中关于 λ 的最高次项一定取自均布项:
(λ−a11)(λ−a22)⋯(λ−ann)
所以,假如我们把 ψ(λ) 写成关于 λ 的 n 次多项式那么它一定形如如下形式:
ψ(λ)=λn+cn−1λn−1+⋯+c1λ+c0
ψ(λ) 是一个首项系数为1的n 次多项式。
实际上,多项式的 n−1 次项系数 cn−1 也只来源于式 (1) ,将式 (1) 进行二项展开,我们不难得出:
cn−1=−(a11+a22+⋯+ann)
a11+a22+⋯+ann 称作矩阵 A 的迹(Trace),记作 tr(A) 。
即 cn−1=−tr(A) 。
对于 ψ(λ) 的常数项系数,显然可以得:
c0=ψ(0)=∣0I−A∣=∣−A∣=(−1)n∣A∣
定理: 设 n 阶方阵 A 的全部特征值为 λ1,λ2,⋯,λn ,则 tr(A)=λ1+λ2+⋯+λn 。
证明:
由特征多项式根与一次因式的关系可得:
ψ(λ)=(λ−λ1)(λ−λ2)⋯(λ−λn)
将等式右端乘开后合并同类项可得其 n−1 次项系数为
cn−1=−(λ1+λ2+⋯+λn)
又由已知结论 cn−1=−tr(A) ,可推得:
tr(A)=λ1+λ2+⋯+λn
定理: 设 n 阶方阵 A 的全部特征值为 λ1,λ2,⋯,λn ,则 ∣A∣=λ1λ2⋯λn 。
证明:
与上面的证明方法类似,将一次因式展开可以得:
c0=(−1)nλ1λ2⋯λn
又由已知结论 c0=(−1)n∣A∣ ,可推得:
∣A∣=λ1λ2⋯λn
推论: 可逆方阵和不可逆方阵的根本区别是:可逆方阵的所有特征值都不为0。
特征向量
设 λ0 是 n 阶方阵 A 的一个特征值,则有 ψ(λ0)=0 ,即 ∣λ0I−A∣=0 。于是,λ0I−A 一定是降秩矩阵,从而齐次线性方程组
(λ0I−A)x=0
必有非零解,该非零解 α 被称为特征向量,并且:
Aα=λ0α
一个特征值可以对应无穷多特征向量,但一个特征向量只能对应一个特征值。
定理: 对于方阵 A ,只要有数 λ0 和非零向量 α 使得 Aα=λ0α 成立,则 λ0 和 α 必然是方阵 A 的一对特征值和特征向量。
矩阵的相似与正交矩阵
矩阵相似
在之前,我们已经了解了矩阵的其中一种关系:等价关系,现在我们来探讨方阵间一种新的关系:相似关系。
相似是同阶方阵之间才存在的一种关系,相似关系具有反身性、对称性和传递性。
定义: 对于 n 阶可逆矩阵 P ,若 P−1AP=B ,则称方阵 A 和 B 相似,写作 A∼B ;可逆矩阵 P 对方阵 A 进行的运算 P−1AP 称作相似变换,P 称为相似因子或相似变化矩阵。
相似矩阵性质:
若 A∼B ,则:
- R(A)=R(B)
- ∣A∣=∣B∣
- AT∼BT
- A−1∼B−1 (若可逆)
- 对任意多项式 f(λ) ,f(A)∼f(B)
- 特征多项式相同,特征值也相同
- tr(A)=tr(B)
相似矩阵特征多项式相同,但特征多项式相同的矩阵未必相似。
通过以上的讨论,我们知道方阵在相似关系下能保存很多固有的性质,如果我们能找到与已知方阵相似的最简形矩阵,在某些场合以该最简形矩阵代替已知矩阵,会使得运算大大简化。因此,寻求与已知方阵相似的最简形矩阵便很有意义。
方阵的相似对角化
若有可逆矩阵 P,使得
P−1AP=Λ=λ1λ2⋱λn
设 P=[α1,α2,⋯,αn] ,则上式可以写成
A[α1,α2,⋯,αn]=[α1,α2,⋯,αn]λ1λ2⋱λn
即
[Aα1,Aα2,⋯,Aαn]=[λ1α1,λ2α2,⋯,λnαn]
于是有
Aαi=λiαi,i=1,2,⋯,n
因为 α1,α2,⋯,αn 是可逆矩阵 P 的列向量组,所以必是线性无关组,也必然是非零向量,因此 αi 是 A 对应于特征值 λi 的特征向量。
当 n 阶矩阵 A 相似于对角矩阵时,该对角矩阵的主对角元素恰是 A 的全部特征值;相似因子 P 的各列恰是 A 的 n 个线性无关的特征向量。
定理: n 阶矩阵 A 能够相似对角化的充要条件是 A 存在 n 个线性无关的特征向量。
推论: 若 A 有 n 个互异的特征根,则 A 一定能相似对角化。(充分非必要条件)
方阵是否能相似对角化的判别方法:
- 若特征多项式只有单根,则一定能相似对角化。
- 若特征多项式既有单根又有重根,则当重根对应的线性无关特征向量个数小于重数时,一定能相似对角化。
一个常见的用相似对角化简化计算的例子是在求矩阵的高次方时:
An=(P−1ΛP)n=P−1ΛPP−1Λ⋯P=P−1AnP
正交矩阵和向量组的正交化
对于 n 维实向量 α,β,如果它们的内积 (α,β)=0,则称 α 和 β 正交,记作 α⊥β。
因为对任何实向量 α,总有 (α,0)=0,所以任何向量都和零向量正交。
如果一组非零向量两两正交,则称这组向量为正交向量组,简称正交组;如果正交向量组中每一个向量都是单位向量,则称该向量为单位正交向量组,简称单位正交组。
正交向量组必是线性无关组。
定义: 如果 n 阶实矩阵 A 的列向量组是单位正交向量组,则称 A 为正交矩阵。
定理: n 阶实矩阵 A 为正交矩阵的充要条件是 ATA=I,即 AT=A−1。
正交矩阵性质:
若 A 是正交矩阵,则:
- −A 也是正交矩阵
- AT(A−1) 也是正交矩阵
- 若 A,B 都是 n 阶正交矩阵,则 AB 也是 n 阶正交矩阵
- ∣A∣=1 或 ∣A∣=−1
定义: 对于 n 阶实矩阵 A,以 n 阶正交矩阵 Q 为相似因子进行的相似变换 Q−1AQ 称为对 A 的正交变换,也可以表示为 QTAQ。
施密特正交化(Schmidt orthogonalization):
将线性无关的实向量组进行正交化(即求与该向量组等价的正交组)是一项很有实用价值的工作,施密特逐步正交化是一种常用的方法,下面简单介绍下它的步骤。
对线性无关的实向量组 α1,α2,⋯,αn,求与之等价的正交组 β1,β2,⋯,βn。
- 令 β1=α1。
- 令 β2=k1(2)β1+α2,为确保 (β2,β1)=0,即
k1(2)(β1,β1)+(α2,β1)=0
则
k1(2)=−(β1,β1)(α2,β1)
- 令 β3=k1(3)β1+k2(3)β2+α3,为确保 (β3,β1)=0,(β3,β2)=0,即可推出
k1(3)=−(β1,β1)(α3,β1),k2(3)=−(β2,β2)(α3,β2)
- 类推可得通式 (j<n):
βj+1=k1(j+1)β1+k2(j+1)β2+⋯+kj(j+1)βj+αj+1
其中
ki(j+1)=−(βi,βi)(αj+1,βi),i=1,2,⋯,j
- 将 β1,β2,⋯,βn 全部用上述方法求出后,进行归一化,得到最终的正交组:
γi=∣∣βi∣∣βi
实对称矩阵的对角化
实对称矩阵是一种特殊的方阵,即对于任意实对称矩阵 A,满足 AT=A。
定理: 实对称矩阵对应于不同特征值的特征向量正交。
证明:
设 A 为实对称矩阵,λ1,λ2 是 A 的两个不同的特征值,α1 和 α2 是 A 分别对应于 λ1 和 λ2 的特征向量,即有
Aα1=λ1α1,Aα2=λ2α2
将前式两端转置并右乘 α2,将后式两端左乘 λ1T,得
α1TAα2=λ2α1Tα2,α1TAα2=λ1α1Tα2
两式相减可得
(λ1−λ2)α1Tα2=0
因为 λ1−λ2=0,所以必然 α1Tα2=0,即 (α1,α2)=0,因此 α1,α2 正交。
定理: 对于 n 阶实对称矩阵 A,有其特殊的相似对角化方法,称为正交相似变换,即必然存在 n 阶正交矩阵 Q,使以下等式成立:
Q−1AQ=Λ=λ1λ2⋱λn
其中 λ1,λ2,⋯,λn 恰是 A 的全部特征值。
实对称矩阵对角化的步骤:
- 求特征值
- 求特征值对应的特征向量
- 将特征向量单位正交化
- 根据正交组写出 Q 和 Λ
二次型与对称矩阵
对二次型的研究起源于二次曲线方程的化简,如下就是一个代表平面上二次曲线的二元二次方程:
a11x2+2a12xy+a22y2+b1x+b2y+c=0
由于一次项在坐标变换后依旧是一次项,为了突出问题的实质,我们取出相关方程中的二次项部分:
f(x,y)=a11x2+2a12xy+a22y2
它是一个二元二次齐次多项式。如果一个 n 元多项式中的每一项都是二次项,则称它为一个 n 元二次齐次式,也就是我们要讨论的 n 元二次型。
定义: n 个变量 x1,x2,⋯,xn 所组成的二次齐次多项式表示为:
f(x1,x2,⋯,xn)=a11x12+2a12x1x2+2a13x1x3+⋯+2a1nx1xn+a22x22+2a23x2x3+⋯+2a2nx2xn+⋯+annxn2
称为 n 元二次型。实数域上的二次型称为实二次型,复数域上的二次型称为复二次型。
二次型可以记作对称矩阵的形式。将上述二次齐次式改写为求和形式:
f(x1,x2,⋯,xn)=i=1∑nj=1∑naijxixj
记作
A=a11a21⋮an1a12a22⋮an2⋯⋯⋯a1na2n⋮ann,x=x1x2⋮xn
f(x)=xTAx
简记为:
f=xTAx
对称矩阵 A 为二次型 f 的矩阵(系数矩阵);把 A 的秩定义为二次型 f 的秩。
平方项的系数直接写在矩阵主对角线上,交叉项的系数除以2放在矩阵两个对称的相应位置上。
合同变换
定义: 只含平方项(不含交叉项)的二次型称为标准形式的二次型,简称为标准形:
g(y)=b1y12+b2y22+⋯+bnyn2
标准形对应的矩阵表示为对角矩阵。
为了将普通的二次型转换为标准形,我们引入一个线性代换:
x=Cy
则
f=xTAx=(Cy)TA(Cy)=yT(CTAC)y
当 y 为标准形时,此时的 CTAC 为对角矩阵,即
CTAC=Λ
此时,称 A 合同于 Λ。
定义: 对于 n 阶矩阵 A,B,如果有 n 阶可逆矩阵 P,使得
PTAP=B
则称矩阵 A 和 B 合同,记作 A≃B。P 对 A 做的变换称为合同变换(Congruent transformation),P 称为合同因子,或合同变换矩阵。合同关系和相似一样,也具有反身性、对称性和传递性。
实对称矩阵相似必合同。
合同矩阵性质:
若 A≃B ,则:
- R(A)=R(B)
- AT≃BT
- 若 A,B 都可逆,则 A−1≃B−1
- 若两个矩阵中有一个为对称矩阵,则另一个也为对称矩阵
二次型的标准形
我们常常需要将普通的二次型转换为标准形,其中正交变换法、配方法和初等变换法和是三个常用的方法,下面我们来一一了解一下。
正交变换法:
正交变换法实际上就是上面所述正交相似的衍生方法,这里简单说明一下,由于太过复杂实际使用并不多。
- 将二次型用矩阵表示出来
- 求二次型矩阵的特征值
- 求特征值对应的特征向量
- 将特征向量单位正交化
- 根据正交组写出 Q 和 Λ
- Λ 即是所要求二次型的标准形对应的矩阵
配方法:
配方法是针对实二次型的一种变换方法,通过一个例子能比较好地说明这个方法。
例: 将 f(x1,x2,x3)=x12+3x22+9x32+2x1x2+2x1x3+10x2x3 化为标准形。
首先选择一个未知数开始配方,由于此处 x12 项系数非零,故可以选择含 x1 的项:
f=x12+2x1(x2+x3)+(x2+x3)2−(x2+x3)2+3x22+10x2x3+9x32=(x1+x2+x3)2+2x22+8x2x3+8x32
确保余下的项不含有 x1,接下来可针对含 x2 的项配方:
f=(x1+x2+x3)2+2(x2+2x3)2
完成配方后,可写出以下代换:
⎩⎨⎧y1y2y3=x1+x2+ x3= x2+2x3=x3
即
⎩⎨⎧x1x2x3=y1−y2+ y3= y2−2y3=y3
由于原式配方后 y3 的系数为零,因此所选取的 y3=x3 并不是唯一的,只要取一个合适的值,并保证变换的系数矩阵可逆即可。
最终化出的标准形结果即为:
y12+2y22
并不是所有二次型都可以直接进行配方,例如下面这种只有交叉项的情况。
例: 将 f(x1,x2,x3)=2x1x2+2x1x3−6x2x3 化为标准形。
该二次型中平方项的系数皆为零,因此可以先做可逆线性变换:
⎩⎨⎧x1x2x3=y1+y2=y1−y2= y3
用矩阵可以表示为
x1x2x3=110 1−1 0001y1y2y3
可得
f=2(y12−2y1y3−y22+4y2y3)
此时再可进行配方:
f=2[(y1−y3)2−(y2−2y3)2+3y32]
令
⎩⎨⎧z1z2z3=y1 − y3= y2−2y3=y3
即化为标准形
2z12−2z22+6z32
初等变换法:
当变量个数较多并且二次型中系数非零的交叉项也较多时,用配方法化二次型为标准形的过程可能非常繁琐,此时用初等变换的方法就较为合适。
定义: 以初等矩阵作合同因子所进行的合同变换称为初等合同变换:
PTAP
一次初等合同变换实际上就是对行、列对称进行的一套初等变换。
定理: 任何合同变换必可经过有限多次初等合同变换实现。
下面演示了一个用初等合同变换将对称矩阵转化为对角矩阵的例子:
12−224−1−2−10−2c1+c212−2003−2−10−2r1+r210−2003−2302c1+c310−200303−42r1+r310000303−443c3+c2100049003−443r3+r2149−4
一般情形,设 n 阶对称矩阵 A 经过 s 次初等合同变换化为对角矩阵 B ,即
PsT⋯P2TP1TAP1P2⋯Ps=B
则由 A 到 B 的合同变换矩阵为
P=P1P2⋯Ps
必然有
P=IP1P2⋯Ps
因此,在进行合同变换时,我们可以在原对称矩阵的下方加上一个单位矩阵,凡是对列的初等变换,单位矩阵都随之一起进行,而行变换则只对原矩阵进行,可以得到
[AI]congruent[BP]
实二次型的规范形
容易发现,与一个非零对称矩阵合同的对角矩阵肯定不唯一,这时候,我们引入规范形的概念,规范形是实二次型矩阵所能化到的最简形态:
1⋱1−1⋱−10⋱0
规范形二次型矩阵只有主对角线上有若干个1、-1或0。
写成二次型为
y12+⋯+yp2−yp+12−⋯−yp+q2
其中,p 称为实二次形 f 的正惯性指数,q 称为负惯性指数,p−q 称为符号差,p+q 就是二次型的秩。
惯性定理: 任何实二次型 f 必可经过(实数域上的)可逆线性变换化为规范形,且实规范形是唯一的。
正定二次型
实二次型又被细分为以下几种类型:
- 正定二次型:对于任意非零实向量 x,都满足 f(x)>0;
- 负定二次型:对于任意非零实向量 x,都满足 f(x)<0;
- 半正定二次型:对于任意实向量 x,都满足 f(x)≥0;
- 半负定二次型:对于任意实向量 x,都满足 f(x)≤0;
- 不定二次型:存在实向量 x1,x2 ,使得 f(x1)>0,f(x2)<0。
正定二次型必然是半正定二次型,负定二次型必然是半负定二次型,不定二次型既不是半正定的,也不是半负定的。
在各类实二次型中,正定二次型最为重要,下面主要讨论正定二次型。
定理: 可逆线性变换保持实二次型的正定性。
正定性的判别:
- n 元实二次型正定的充要条件是其标准形中 n 个平方项的系数全大于零。
- 实二次型 f(x)=xTAx 正定的充要条件是 A 的特征值全部大于零。
- n 元实二次型 f(x) 正定的充要条件是它的正惯性指数为 n。
- 实二次型 f(x)=xTAx 正定的充要条件是 A 的所有顺序主子式全大于零。
对于 n 阶方阵 A=(aij),它的子式
∣Ak∣=a11a21⋮ak1a21a22⋮ak2⋯⋯⋯a1ka2k⋮akk(k=1,2,⋯,n)
称为 A 的 k 阶顺序主子式。
正定矩阵:
对于实对称矩阵 A,如果实二次型 f(x)=xTAx 正定,则称 A 是正定矩阵。
- 实对称矩阵 A 正定的充要条件是 A 可以合同于一个主对角元全为正数的对角矩阵。
- 实对称矩阵 A 正定的充要条件是 A 的特征值全大于零。
- 实对称矩阵 A 正定的充要条件是 A 的所有顺序主子式全大于零。
- n 阶实对称矩阵 A 正定的充要条件是 A 的正惯性系数为 n。
- 实对称矩阵 A 正定的充要条件是 A≃I。