方阵的特征值与特征向量

特征值与特征多项式

对于 nn 阶方阵 A=(aij)\bm A=(a_{ij}) ,把含有字母 λ\lambda 的方阵

λIA=[λa11a12a1na12λa22a2nan1an2λann]\lambda\bm I-\bm A=\begin{bmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{12}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{bmatrix}

称为 A\bm A特征矩阵(Eigenmatrix)

行列式 λIA|\lambda\bm I-\bm A| 的值表达式 ψ(λ)\psi(\lambda) 是一个多项式,称为 A\bm A特征多项式(Characteristic polynomial),特征多项式的根称为 A\bm A特征值(Eigenvalue)特征根

如果 λ0\lambda_0 是特征多项式的单根,则称 λ0\lambda_0单特征值,否则称为重特征值

为了研究特征多项式的性质,我们将行列式的完整形式写出:

ψ(λ)=λa11a12a1na12λa22a2nan1an2λann\psi(\lambda)=\begin{vmatrix}\lambda-a_{11}&-a_{12}&\cdots&-a_{1n}\\ -a_{12}&\lambda-a_{22}&\cdots&-a_{2n}\\ \vdots&\vdots&&\vdots\\ -a_{n1}&-a_{n2}&\cdots&\lambda-a_{nn}\end{vmatrix}

由行列式的排列计算法可知, ψ(λ)\psi(\lambda) 中关于 λ\lambda 的最高次项一定取自均布项:

(λa11)(λa22)(λann)\begin{equation} (\lambda-a_{11})(\lambda-a_{22})\cdots(\lambda-a_{nn}) \end{equation}

所以,假如我们把 ψ(λ)\psi(\lambda) 写成关于 λ\lambdann 次多项式那么它一定形如如下形式:

ψ(λ)=λn+cn1λn1++c1λ+c0\psi(\lambda)=\lambda^n+c_{n-1}\lambda^{n-1}+\cdots+c_1\lambda+c_0

ψ(λ)\psi(\lambda) 是一个首项系数为1的nn 次多项式。

实际上,多项式的 n1n-1 次项系数 cn1c_{n-1} 也只来源于式 (1)(1) ,将式 (1)(1) 进行二项展开,我们不难得出:

cn1=(a11+a22++ann)c_{n-1}=-(a_{11}+a_{22}+\cdots+a_{nn})

a11+a22++anna_{11}+a_{22}+\cdots+a_{nn} 称作矩阵 A\bm A迹(Trace),记作 tr(A)\text{tr}(\bm A)

cn1=tr(A)c_{n-1}=-\text{tr}(\bm A)

对于 ψ(λ)\psi(\lambda) 的常数项系数,显然可以得:

c0=ψ(0)=0IA=A=(1)nAc_0=\psi(0)=|0\bm I-\bm A|=|-\bm A|=(-1)^n|\bm A|

定理:nn 阶方阵 A\bm A 的全部特征值为 λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n ,则 tr(A)=λ1+λ2++λn\text{tr}(\bm A)=\lambda_1+\lambda_2+\cdots+\lambda_n

证明:

由特征多项式根与一次因式的关系可得:

ψ(λ)=(λλ1)(λλ2)(λλn)\psi(\lambda)=(\lambda-\lambda_1)(\lambda-\lambda_2)\cdots(\lambda-\lambda_n)

将等式右端乘开后合并同类项可得其 n1n-1 次项系数为

cn1=(λ1+λ2++λn)c_{n-1}=-(\lambda_1+\lambda_2+\cdots+\lambda_n)

又由已知结论 cn1=tr(A)c_{n-1}=-\text{tr}(\bm A) ,可推得:

tr(A)=λ1+λ2++λn\text{tr}(\bm A)=\lambda_1+\lambda_2+\cdots+\lambda_n

定理:nn 阶方阵 A\bm A 的全部特征值为 λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n ,则 A=λ1λ2λn|\bm A|=\lambda_1\lambda_2\cdots\lambda_n

证明:

与上面的证明方法类似,将一次因式展开可以得:

c0=(1)nλ1λ2λnc_0=(-1)^n\lambda_1\lambda_2\cdots\lambda_n

又由已知结论 c0=(1)nAc_0=(-1)^n|\bm A| ,可推得:

A=λ1λ2λn|\bm A|=\lambda_1\lambda_2\cdots\lambda_n

推论: 可逆方阵和不可逆方阵的根本区别是:可逆方阵的所有特征值都不为0。

特征向量

λ0\lambda_0nn 阶方阵 A\bm A 的一个特征值,则有 ψ(λ0)=0\psi(\lambda_0)=0 ,即 λ0IA=0|\lambda_0\bm I-\bm A|=0 。于是,λ0IA\lambda_0\bm I-\bm A 一定是降秩矩阵,从而齐次线性方程组

(λ0IA)x=0(\lambda_0\bm I-\bm A)\bm x = \bm 0

必有非零解,该非零解 α\bm\alpha 被称为特征向量,并且:

Aα=λ0α\bm{A\alpha}=\lambda_0\bm\alpha

一个特征值可以对应无穷多特征向量,但一个特征向量只能对应一个特征值。

定理: 对于方阵 A\bm A ,只要有数 λ0\lambda_0 和非零向量 α\bm\alpha 使得 Aα=λ0α\bm{A\alpha}=\lambda_0\bm\alpha 成立,则 λ0\lambda_0α\bm\alpha 必然是方阵 A\bm A 的一对特征值和特征向量。

矩阵的相似与正交矩阵

矩阵相似

在之前,我们已经了解了矩阵的其中一种关系:等价关系,现在我们来探讨方阵间一种新的关系:相似关系。

相似是同阶方阵之间才存在的一种关系,相似关系具有反身性、对称性和传递性。

定义: 对于 nn 阶可逆矩阵 P\bm P ,若 P1AP=B\bm P^{-1}\bm A\bm P=\bm B ,则称方阵 A\bm AB\bm B 相似,写作 AB\bm A\sim \bm B ;可逆矩阵 P\bm P 对方阵 A\bm A 进行的运算 P1AP\bm P^{-1}\bm A\bm P 称作相似变换P\bm P 称为相似因子相似变化矩阵

相似矩阵性质:

AB\bm A\sim \bm B ,则:

  1. R(A)=R(B)R(\bm A)=R(\bm B)
  2. A=B|\bm A|=|\bm B|
  3. ATBT\bm A^T\sim\bm B^T
  4. A1B1\bm A^{-1}\sim\bm B^{-1} (若可逆)
  5. 对任意多项式 f(λ)f(\lambda)f(A)f(B)f(A)\sim f(B)
  6. 特征多项式相同,特征值也相同
  7. tr(A)=tr(B)\text{tr}(\bm A)=\text{tr}(\bm B)

相似矩阵特征多项式相同,但特征多项式相同的矩阵未必相似。

通过以上的讨论,我们知道方阵在相似关系下能保存很多固有的性质,如果我们能找到与已知方阵相似的最简形矩阵,在某些场合以该最简形矩阵代替已知矩阵,会使得运算大大简化。因此,寻求与已知方阵相似的最简形矩阵便很有意义。

方阵的相似对角化

若有可逆矩阵 P\bm P,使得

P1AP=Λ=[λ1λ2λn]\bm P^{-1}\bm A\bm P=\bm\Lambda=\begin{bmatrix}\lambda_1\\&\lambda_2\\&&\ddots\\&&&\lambda_n\end{bmatrix}

P=[α1,α2,,αn]\bm P=[\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n] ,则上式可以写成

A[α1,α2,,αn]=[α1,α2,,αn][λ1λ2λn]\bm A[\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n]=[\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n]\begin{bmatrix}\lambda_1\\&\lambda_2\\&&\ddots\\&&&\lambda_n\end{bmatrix}

[Aα1,Aα2,,Aαn]=[λ1α1,λ2α2,,λnαn][\bm{A\alpha}_1,\bm{A\alpha}_2,\cdots,\bm{A\alpha}_n]=[\lambda_1\bm\alpha_1,\lambda_2\bm\alpha_2,\cdots,\lambda_n\bm\alpha_n]

于是有

Aαi=λiαi,i=1,2,,n\bm A\bm\alpha_i=\lambda_i\bm\alpha_i,\qquad i=1,2,\cdots,n

因为 α1,α2,,αn\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n 是可逆矩阵 P\bm P 的列向量组,所以必是线性无关组,也必然是非零向量,因此 αi\bm\alpha_iA\bm A 对应于特征值 λi\lambda_i 的特征向量。

nn 阶矩阵 A\bm A 相似于对角矩阵时,该对角矩阵的主对角元素恰是 A\bm A 的全部特征值;相似因子 P\bm P 的各列恰是 A\bm Ann 个线性无关的特征向量。

定理: nn 阶矩阵 A\bm A 能够相似对角化的充要条件是 A\bm A 存在 nn 个线性无关的特征向量。

推论:A\bm Ann 个互异的特征根,则 A\bm A 一定能相似对角化。(充分非必要条件)

方阵是否能相似对角化的判别方法:

  1. 若特征多项式只有单根,则一定能相似对角化。
  2. 若特征多项式既有单根又有重根,则当重根对应的线性无关特征向量个数小于重数时,一定能相似对角化。

一个常见的用相似对角化简化计算的例子是在求矩阵的高次方时:

An=(P1ΛP)n=P1ΛPP1ΛP=P1AnP\bm A^n=(\bm P^{-1}\bm\Lambda\bm P)^n=\bm P^{-1}\bm\Lambda\bm P\bm P^{-1}\bm\Lambda\cdots\bm P=\bm P^{-1}\bm A^n\bm P

正交矩阵和向量组的正交化

对于 nn 维实向量 α,β\bm\alpha,\bm\beta,如果它们的内积 (α,β)=0\bm{(\alpha},\bm{\beta)}=0,则称 α\bm\alphaβ\bm\beta 正交,记作 αβ\bm\alpha\perp\bm\beta

因为对任何实向量 α\bm\alpha,总有 (α,0)=0\bm{(\alpha},\bm{0)}=0,所以任何向量都和零向量正交。

如果一组非零向量两两正交,则称这组向量为正交向量组,简称正交组;如果正交向量组中每一个向量都是单位向量,则称该向量为单位正交向量组,简称单位正交组

正交向量组必是线性无关组。

定义: 如果 nn 阶实矩阵 A\bm A 的列向量组是单位正交向量组,则称 A\bm A正交矩阵

定理: nn 阶实矩阵 A\bm A 为正交矩阵的充要条件是 ATA=I\bm A^T\bm A=\bm I,即 AT=A1\bm A^T=\bm A^{-1}

正交矩阵性质:

A\bm A 是正交矩阵,则:

  1. A-\bm A 也是正交矩阵
  2. AT(A1)\bm A^T(\bm A^{-1}) 也是正交矩阵
  3. A,B\bm A,\bm B 都是 nn 阶正交矩阵,则 AB\bm{AB} 也是 nn 阶正交矩阵
  4. A=1|\bm A|=1A=1|\bm A|=-1

定义: 对于 nn 阶实矩阵 A\bm A,以 nn 阶正交矩阵 Q\bm Q 为相似因子进行的相似变换 Q1AQ\bm Q^{-1}\bm A\bm Q 称为对 A\bm A正交变换,也可以表示为 QTAQ\bm Q^T\bm A\bm Q

施密特正交化(Schmidt orthogonalization):

将线性无关的实向量组进行正交化(即求与该向量组等价的正交组)是一项很有实用价值的工作,施密特逐步正交化是一种常用的方法,下面简单介绍下它的步骤。

对线性无关的实向量组 α1,α2,,αn\bm\alpha_1,\bm\alpha_2,\cdots,\bm\alpha_n,求与之等价的正交组 β1,β2,,βn\bm\beta_1,\bm\beta_2,\cdots,\bm\beta_n

  1. β1=α1\bm\beta_1=\bm\alpha_1
  2. β2=k1(2)β1+α2\bm\beta_2=k_1^{(2)}\bm\beta_1+\bm\alpha_2,为确保 (β2,β1)=0\bm(\bm\beta_2,\bm\beta_1\bm)=0,即

k1(2)(β1,β1)+(α2,β1)=0k_1^{(2)}\bm(\bm\beta_1,\bm\beta_1\bm)+\bm(\bm\alpha_2,\bm\beta_1\bm)=0

k1(2)=(α2,β1)(β1,β1)k_1^{(2)}=-\frac{\bm(\bm\alpha_2,\bm\beta_1\bm)}{\bm(\bm\beta_1,\bm\beta_1\bm)}

  1. β3=k1(3)β1+k2(3)β2+α3\bm\beta_3=k_1^{(3)}\bm\beta_1+k_2^{(3)}\bm\beta_2+\bm\alpha_3,为确保 (β3,β1)=0,(β3,β2)=0\bm(\bm\beta_3,\bm\beta_1\bm)=0,\bm(\bm\beta_3,\bm\beta_2\bm)=0,即可推出

k1(3)=(α3,β1)(β1,β1),k2(3)=(α3,β2)(β2,β2)k_1^{(3)}=-\frac{\bm(\bm\alpha_3,\bm\beta_1\bm)}{\bm(\bm\beta_1,\bm\beta_1\bm)},\qquad k_2^{(3)}=-\frac{\bm(\bm\alpha_3,\bm\beta_2\bm)}{\bm(\bm\beta_2,\bm\beta_2\bm)}

  1. 类推可得通式 (j<n)(j<n)

βj+1=k1(j+1)β1+k2(j+1)β2++kj(j+1)βj+αj+1\bm\beta_{j+1}=k_1^{(j+1)}\bm\beta_1+k_2^{(j+1)}\bm\beta_2+\cdots+k_j^{(j+1)}\bm\beta_j+\bm\alpha_{j+1}

其中

ki(j+1)=(αj+1,βi)(βi,βi),i=1,2,,jk_i^{(j+1)}=-\frac{\bm(\bm\alpha_{j+1},\bm\beta_i\bm)}{\bm(\bm\beta_i,\bm\beta_i\bm)},\qquad i=1,2,\cdots,j

  1. β1,β2,,βn\bm\beta_1,\bm\beta_2,\cdots,\bm\beta_n 全部用上述方法求出后,进行归一化,得到最终的正交组:

γi=βiβi\bm\gamma_i=\frac{\bm\beta_i}{||\bm\beta_i||}

实对称矩阵的对角化

实对称矩阵是一种特殊的方阵,即对于任意实对称矩阵 A\bm A,满足 AT=A\bm A^T=\bm A

定理: 实对称矩阵对应于不同特征值的特征向量正交。

证明:

A\bm A 为实对称矩阵,λ1,λ2\lambda_1,\lambda_2A\bm A 的两个不同的特征值,α1\bm\alpha_1α2\bm\alpha_2A\bm A 分别对应于 λ1\lambda_1λ2\lambda_2 的特征向量,即有

Aα1=λ1α1,Aα2=λ2α2\bm A\bm\alpha_1=\lambda_1\bm\alpha_1,\qquad \bm A\bm\alpha_2=\lambda_2\bm\alpha_2

将前式两端转置并右乘 α2\bm\alpha_2,将后式两端左乘 λ1T\lambda_1^T,得

α1TAα2=λ2α1Tα2,α1TAα2=λ1α1Tα2\bm\alpha_1^T\bm A\bm\alpha_2=\lambda_2\bm\alpha_1^T\bm\alpha_2,\qquad\bm\alpha_1^T\bm A\bm\alpha_2=\lambda_1\bm\alpha_1^T\bm\alpha_2

两式相减可得

(λ1λ2)α1Tα2=0(\lambda_1-\lambda_2)\bm\alpha_1^T\bm\alpha_2=0

因为 λ1λ20\lambda_1-\lambda_2\neq 0,所以必然 α1Tα2=0\bm\alpha_1^T\bm\alpha_2=0,即 (α1,α2)=0\bm(\bm\alpha_1,\bm\alpha_2\bm)=0,因此 α1,α2\bm\alpha_1,\bm\alpha_2 正交。

定理: 对于 nn 阶实对称矩阵 A\bm A,有其特殊的相似对角化方法,称为正交相似变换,即必然存在 nn 阶正交矩阵 Q\bm Q,使以下等式成立:

Q1AQ=Λ=[λ1λ2λn]\bm Q^{-1}\bm A\bm Q=\bm\Lambda=\begin{bmatrix}\lambda_1\\&\lambda_2\\&&\ddots\\&&&\lambda_n\end{bmatrix}

其中 λ1,λ2,,λn\lambda_1,\lambda_2,\cdots,\lambda_n 恰是 A\bm A 的全部特征值。

实对称矩阵对角化的步骤:

  1. 求特征值
  2. 求特征值对应的特征向量
  3. 将特征向量单位正交化
  4. 根据正交组写出 Q\bm QΛ\bm\Lambda

二次型与对称矩阵

对二次型的研究起源于二次曲线方程的化简,如下就是一个代表平面上二次曲线的二元二次方程:

a11x2+2a12xy+a22y2+b1x+b2y+c=0a_{11}x^2+2a_{12}xy+a_{22}y^2+b_1x+b_2y+c=0

由于一次项在坐标变换后依旧是一次项,为了突出问题的实质,我们取出相关方程中的二次项部分:

f(x,y)=a11x2+2a12xy+a22y2f(x,y)=a_{11}x^2+2a_{12}xy+a_{22}y^2

它是一个二元二次齐次多项式。如果一个 nn 元多项式中的每一项都是二次项,则称它为一个 nn 元二次齐次式,也就是我们要讨论的 nn 元二次型。

定义: nn 个变量 x1,x2,,xnx_1,x_2,\cdots,x_n 所组成的二次齐次多项式表示为:

f(x1,x2,,xn)=a11x12+2a12x1x2+2a13x1x3++2a1nx1xn+a22x22+2a23x2x3++2a2nx2xn++annxn2\begin{aligned}f(x_1,x_2,\cdots,x_n)&=a_{11}x_1^2+2a_{12}x_1x_2+2a_{13}x_1x_3+\cdots+2a_{1n}x_1x_n\\ &+a_{22}x_2^2+2a_{23}x_2x_3+\cdots+2a_{2n}x_2x_n+\cdots+a_{nn}x_n^2\end{aligned}

称为 nn二次型。实数域上的二次型称为实二次型,复数域上的二次型称为复二次型

二次型可以记作对称矩阵的形式。将上述二次齐次式改写为求和形式:

f(x1,x2,,xn)=i=1nj=1naijxixjf(x_1,x_2,\cdots,x_n)=\sum_{i=1}^n\sum_{j=1}^na_{ij}x_ix_j

记作

A=[a11a12a1na21a22a2nan1an2ann],x=[x1x2xn]\bm A=\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{bmatrix},\qquad\bm x=\begin{bmatrix}x_1\\x_2\\\vdots\\x_n\end{bmatrix}

f(x)=xTAxf(\bm x)=\bm x^T\bm A\bm x

简记为:

f=xTAxf=\bm x^T\bm A\bm x

对称矩阵 A\bm A 为二次型 ff 的矩阵(系数矩阵);把 A\bm A 的秩定义为二次型 ff 的秩。

平方项的系数直接写在矩阵主对角线上,交叉项的系数除以2放在矩阵两个对称的相应位置上。

合同变换

定义: 只含平方项(不含交叉项)的二次型称为标准形式的二次型,简称为标准形

g(y)=b1y12+b2y22++bnyn2g(\bm y)=b_1y_1^2+b_2y_2^2+\cdots+b_ny_n^2

标准形对应的矩阵表示为对角矩阵。

为了将普通的二次型转换为标准形,我们引入一个线性代换:

x=Cy\bm x=\bm C\bm y

f=xTAx=(Cy)TA(Cy)=yT(CTAC)y\begin{aligned}f&=\bm x^T\bm A\bm x\\ &=(\bm{Cy})^T\bm A(\bm{Cy})\\ &=\bm y^T(\bm C^T\bm A\bm C)\bm y\end{aligned}

y\bm y 为标准形时,此时的 CTAC\bm C^T\bm A\bm C 为对角矩阵,即

CTAC=Λ\bm C^T\bm A\bm C=\bm\Lambda

此时,称 A\bm A 合同于 Λ\bm\Lambda

定义: 对于 nn 阶矩阵 A,B\bm A,\bm B,如果有 nn 阶可逆矩阵 P\bm P,使得

PTAP=B\bm P^T\bm A\bm P=\bm B

则称矩阵 A\bm AB\bm B 合同,记作 AB\bm A\simeq\bm BP\bm PA\bm A 做的变换称为合同变换(Congruent transformation)P\bm P 称为合同因子,或合同变换矩阵。合同关系和相似一样,也具有反身性、对称性和传递性。

实对称矩阵相似必合同。

合同矩阵性质:

AB\bm A\simeq \bm B ,则:

  1. R(A)=R(B)R(\bm A)=R(\bm B)
  2. ATBT\bm A^T\simeq\bm B^T
  3. A,B\bm A,\bm B 都可逆,则 A1B1\bm A^{-1}\simeq\bm B^{-1}
  4. 若两个矩阵中有一个为对称矩阵,则另一个也为对称矩阵

二次型的标准形

我们常常需要将普通的二次型转换为标准形,其中正交变换法、配方法和初等变换法和是三个常用的方法,下面我们来一一了解一下。

正交变换法:

正交变换法实际上就是上面所述正交相似的衍生方法,这里简单说明一下,由于太过复杂实际使用并不多。

  1. 将二次型用矩阵表示出来
  2. 求二次型矩阵的特征值
  3. 求特征值对应的特征向量
  4. 将特征向量单位正交化
  5. 根据正交组写出 Q\bm QΛ\bm\Lambda
  6. Λ\bm\Lambda 即是所要求二次型的标准形对应的矩阵

配方法:

配方法是针对实二次型的一种变换方法,通过一个例子能比较好地说明这个方法。

例:f(x1,x2,x3)=x12+3x22+9x32+2x1x2+2x1x3+10x2x3f(x_1,x_2,x_3)=x_1^2+3x_2^2+9x_3^2+2x_1x_2+2x_1x_3+10x_2x_3 化为标准形。

首先选择一个未知数开始配方,由于此处 x12x_1^2 项系数非零,故可以选择含 x1x_1 的项:

f=x12+2x1(x2+x3)+(x2+x3)2(x2+x3)2+3x22+10x2x3+9x32=(x1+x2+x3)2+2x22+8x2x3+8x32\begin{aligned}f&=x_1^2+2x_1(x_2+x_3)+(x_2+x_3)^2-(x_2+x_3)^2+3x_2^2+10x_2x_3+9x_3^2\\ &=(x_1+x_2+x_3)^2+2x_2^2+8x_2x_3+8x_3^2\end{aligned}

确保余下的项不含有 x1x_1,接下来可针对含 x2x_2 的项配方:

f=(x1+x2+x3)2+2(x2+2x3)2f=(x_1+x_2+x_3)^2+2(x_2+2x_3)^2

完成配方后,可写出以下代换:

{y1=x1+x2+  x3y2= x2+2x3y3=x3\left\{\begin{aligned}y_1&=x_1+x_2+\ \ x_3\\ y_2&=\ \qquad x_2+2x_3\\ y_3&=\qquad\qquad\quad x_3\end{aligned}\right.

{x1=y1y2+  y3x2= y22y3x3=y3\left\{\begin{aligned}x_1&=y_1-y_2+\ \ y_3\\ x_2&=\ \qquad y_2-2y_3\\ x_3&=\qquad\qquad\quad y_3\end{aligned}\right.

由于原式配方后 y3y_3 的系数为零,因此所选取的 y3=x3y_3=x_3 并不是唯一的,只要取一个合适的值,并保证变换的系数矩阵可逆即可。

最终化出的标准形结果即为:

y12+2y22y_1^2+2y_2^2

并不是所有二次型都可以直接进行配方,例如下面这种只有交叉项的情况。

例:f(x1,x2,x3)=2x1x2+2x1x36x2x3f(x_1,x_2,x_3)=2x_1x_2+2x_1x_3-6x_2x_3 化为标准形。

该二次型中平方项的系数皆为零,因此可以先做可逆线性变换:

{x1=y1+y2x2=y1y2x3=  y3\left\{\begin{aligned}x_1&=y_1+y_2\\ x_2&=y_1-y_2\\ x_3&=\qquad\quad\ \ y_3\end{aligned}\right.

用矩阵可以表示为

[x1x2x3]=[1   101100   01][y1y2y3]\begin{bmatrix}x_1\\x_2\\x_3\end{bmatrix} =\begin{bmatrix}1&\ \ \ 1&0\\1&-1&0\\0&\ \ \ 0&1\end{bmatrix} \begin{bmatrix}y_1\\y_2\\y_3\end{bmatrix}

可得

f=2(y122y1y3y22+4y2y3)f=2(y_1^2-2y_1y_3-y_2^2+4y_2y_3)

此时再可进行配方:

f=2[(y1y3)2(y22y3)2+3y32]f=2\left[(y_1-y_3)^2-(y_2-2y_3)^2+3y_3^2\right]

{z1=y1   y3z2= y22y3z3=y3\left\{\begin{aligned}z_1&=y_1\ \quad-\ \ y_3\\ z_2&=\quad\ y_2-2y_3\\ z_3&=\qquad\qquad y_3\end{aligned}\right.

即化为标准形

2z122z22+6z322z_1^2-2z_2^2+6z_3^2

初等变换法:

当变量个数较多并且二次型中系数非零的交叉项也较多时,用配方法化二次型为标准形的过程可能非常繁琐,此时用初等变换的方法就较为合适。

定义: 以初等矩阵作合同因子所进行的合同变换称为初等合同变换

PTAP\bm P^T\bm A\bm P

一次初等合同变换实际上就是对行、列对称进行的一套初等变换。

定理: 任何合同变换必可经过有限多次初等合同变换实现。

下面演示了一个用初等合同变换将对称矩阵转化为对角矩阵的例子:

[122241210]2c1+c2[102201230]2r1+r2[102003230]2c1+c3[100003234]2r1+r3[100003034]34c3+c2[1000943004]34r3+r2[1944]\begin{bmatrix}1&2&-2\\2&4&-1\\-2&-1&0\end{bmatrix} \xrightarrow{-2c_1+c_2} \begin{bmatrix}1&0&-2\\2&0&-1\\-2&3&0\end{bmatrix} \xrightarrow{-2r_1+r_2} \begin{bmatrix}1&0&-2\\0&0&3\\-2&3&0\end{bmatrix}\\ \xrightarrow{2c_1+c_3} \begin{bmatrix}1&0&0\\0&0&3\\-2&3&-4\end{bmatrix} \xrightarrow{2r_1+r_3} \begin{bmatrix}1&0&0\\0&0&3\\0&3&-4\end{bmatrix} \xrightarrow{\frac{3}{4}c_3+c_2} \begin{bmatrix}1&0&0\\0&\dfrac{9}{4}&3\\0&0&-4\end{bmatrix} \xrightarrow{\frac{3}{4}r_3+r_2} \begin{bmatrix}1\\&\dfrac{9}{4}\\&&-4\end{bmatrix}

一般情形,设 nn 阶对称矩阵 A\bm A 经过 ss 次初等合同变换化为对角矩阵 B\bm B ,即

PsTP2TP1TAP1P2Ps=B\bm P_s^T\cdots\bm P_2^T\bm P_1^T\bm A\bm P_1\bm P_2\cdots\bm P_s=\bm B

则由 A\bm AB\bm B 的合同变换矩阵为

P=P1P2Ps\bm P=\bm P_1\bm P_2\cdots\bm P_s

必然有

P=IP1P2Ps\bm P=\bm I\bm P_1\bm P_2\cdots\bm P_s

因此,在进行合同变换时,我们可以在原对称矩阵的下方加上一个单位矩阵,凡是对列的初等变换,单位矩阵都随之一起进行,而行变换则只对原矩阵进行,可以得到

[AI]congruent[BP]\begin{bmatrix}\bm A\\\bm I\end{bmatrix}\xrightarrow{congruent}\begin{bmatrix}\bm B\\\bm P\end{bmatrix}

实二次型的规范形

容易发现,与一个非零对称矩阵合同的对角矩阵肯定不唯一,这时候,我们引入规范形的概念,规范形是实二次型矩阵所能化到的最简形态:

[111100]\begin{bmatrix}1\\&\ddots\\&&1\\&&&-1\\&&&&\ddots\\&&&&&-1\\&&&&&&0\\&&&&&&&\ddots\\&&&&&&&&0\end{bmatrix}

规范形二次型矩阵只有主对角线上有若干个1、-1或0。

写成二次型为

y12++yp2yp+12yp+q2y_1^2+\cdots+y_p^2-y_{p+1}^2-\cdots-y_{p+q}^2

其中,pp 称为实二次形 ff正惯性指数qq 称为负惯性指数pqp-q 称为符号差p+qp+q 就是二次型的秩。

惯性定理: 任何实二次型 ff 必可经过(实数域上的)可逆线性变换化为规范形,且实规范形是唯一的。

正定二次型

实二次型又被细分为以下几种类型:

  1. 正定二次型:对于任意非零实向量 x\bm x,都满足 f(x)>0f(\bm x)>0
  2. 负定二次型:对于任意非零实向量 x\bm x,都满足 f(x)<0f(\bm x)<0
  3. 半正定二次型:对于任意实向量 x\bm x,都满足 f(x)0f(\bm x)\geq 0
  4. 半负定二次型:对于任意实向量 x\bm x,都满足 f(x)0f(\bm x)\leq 0
  5. 不定二次型:存在实向量 x1,x2\bm x_1,\bm x_2 ,使得 f(x1)>0,f(x2)<0f(\bm x_1)>0,f(\bm x_2)<0

正定二次型必然是半正定二次型,负定二次型必然是半负定二次型,不定二次型既不是半正定的,也不是半负定的。

在各类实二次型中,正定二次型最为重要,下面主要讨论正定二次型。

定理: 可逆线性变换保持实二次型的正定性。

正定性的判别:

  1. nn 元实二次型正定的充要条件是其标准形中 nn 个平方项的系数全大于零。
  2. 实二次型 f(x)=xTAxf(\bm x)=\bm x^T\bm A\bm x 正定的充要条件是 A\bm A 的特征值全部大于零。
  3. nn 元实二次型 f(x)f(\bm x) 正定的充要条件是它的正惯性指数为 nn
  4. 实二次型 f(x)=xTAxf(\bm x)=\bm x^T\bm A\bm x 正定的充要条件是 A\bm A 的所有顺序主子式全大于零。

对于 nn 阶方阵 A=(aij)\bm A=(a_{ij}),它的子式

Ak=a11a21a1ka21a22a2kak1ak2akk(k=1,2,,n)|\bm A_k|=\begin{vmatrix}a_{11}&a_{21}&\cdots&a_{1k}\\ a_{21}&a_{22}&\cdots&a_{2k}\\ \vdots&\vdots&&\vdots\\ a_{k1}&a_{k2}&\cdots&a_{kk}\end{vmatrix}\qquad (k=1,2,\cdots,n)

称为 A\bm Akk 阶顺序主子式。

正定矩阵:

对于实对称矩阵 A\bm A,如果实二次型 f(x)=xTAxf(\bm x)=\bm x^T\bm A\bm x 正定,则称 A\bm A正定矩阵

  1. 实对称矩阵 A\bm A 正定的充要条件是 A\bm A 可以合同于一个主对角元全为正数的对角矩阵。
  2. 实对称矩阵 A\bm A 正定的充要条件是 A\bm A 的特征值全大于零。
  3. 实对称矩阵 A\bm A 正定的充要条件是 A\bm A 的所有顺序主子式全大于零。
  4. nn 阶实对称矩阵 A\bm A 正定的充要条件是 A\bm A 的正惯性系数为 nn
  5. 实对称矩阵 A\bm A 正定的充要条件是 AI\bm A\simeq\bm I