矩阵基本概念

矩阵(Matrix)是线性代数中主要的研究对象,在此,我会给出在本博客中使用的所有矩阵基本符号及定义,后面所有关于线性代数的讨论都将以此作为基础。

m×nm\times n 个数排成 mm 行的数表

[a11a12a1na21a22a2nam1am2amn]\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{bmatrix}

称作 m×nm\times n 矩阵,记作 A=(aij)m×n\bm A=(a_{ij})_{m\times n} ,其中 aija_{ij} 是矩阵第 ii 行第 jj 列的元素,称作 (i,j)(i,j) 元,元素为实数的矩阵称作实矩阵,元素为复数的矩阵称作复矩阵,两个矩阵行数列数相同则称为同型矩阵,同型矩阵对应元素相同则称作相等矩阵。

m×nm\times n 个元素全为零的矩阵称作零矩阵,记作 O\bm O

主对角线元素全为1的矩阵称作单位矩阵,记作 I\bm IE\bm E

I=[100010001]\bm I=\begin{bmatrix} 1&0&\cdots&0\\ 0&1&\cdots&0\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&1 \end{bmatrix}

m=1m=1 时,称 Am×n\bm A_{m\times n} 为行矩阵或行向量;
n=1n=1 时,称 Am×n\bm A_{m\times n} 为列矩阵或列向量;
m=nm=n 时,称 A\bm Ann 阶方阵,简记为 An\bm A_n

矩阵基本运算

矩阵加法(仅限于同型矩阵):

A+B=(aij+bij)\bm A+\bm B=(a_{ij}+b_{ij})

负矩阵: A+(A)=O\bm A+(-\bm A)=\bm O

矩阵加法满足交换律和结合律。

数乘矩阵:

  1. λ(μA)=(λμ)A\lambda(\mu\bm A)=(\lambda\mu)\bm A
  2. (μ+λ)A=μA+λA(\mu+\lambda)\bm A=\mu\bm A+\lambda\bm A
  3. λ(A+B)=λA+λB\lambda(\bm A+\bm B)=\lambda\bm A+\lambda\bm B
  4. (1)A=A(-1)\bm A=-\bm A

矩阵乘法:

C=AB\bm C=\bm A\bm B

只有当左乘矩阵 A\bm A 的列数等于右乘矩阵 B\bm B 的行数时,矩阵才能相乘,所得矩阵 C\bm C 的行数与 A\bm A 的行数一致,列数与 B\bm B 的列数一致。

对乘加法则: C\bm C 的任一元素就等于这个元素所在行对应于 A\bm A 的行向量和这个元素所在列对应于 B\bm B 的列向量的点乘:

cij=k=1naikbkj(i=1,2,,m;j=1,2,,p)c_{ij}=\sum_{k=1}^na_{ik}b_{kj}\quad(i=1,2,\cdots,m;j=1,2,\cdots,p)

矩阵乘法满足结合律和分配律,但不满足交换律。

任何矩阵和单位矩阵相乘都等于其本身。

矩阵的幂:

  1. AkAl=Ak+l\bm A^k\bm A^l=\bm A^{k+l}
  2. (Ak)l=Akl(\bm A^k)^l=\bm A^{kl}

(AB)k=AkBk(\bm{AB})^k=\bm A^k\bm B^k 不一定成立。

矩阵转置:

矩阵转置就是将矩阵每一元素的行列位置互换:

(aij)T=(aji)(a_{ij})^T=(a_{ji})

  1. (AT)T=A(\bm A^T)^T=\bm A
  2. (A+B)T=AT+BT(\bm A+\bm B)^T=\bm A^T+\bm B^T
  3. (λA)T=λAT(\lambda\bm A)^T=\lambda\bm A^T
  4. (AB)T=BTAT(\bm A\bm B)^T=\bm B^T\bm A^T

矩阵的分块运算

A=[A11A12A1tA21A22A2tAs1As2Ast]\bm A=\begin{bmatrix} \bm A_{11}&\bm A_{12}&\cdots&\bm A_{1t}\\ \bm A_{21}&\bm A_{22}&\cdots&\bm A_{2t}\\ \vdots&\vdots&&\vdots\\ \bm A_{s1}&\bm A_{s2}&\cdots&\bm A_{st} \end{bmatrix}

分块加法运算(仅限于分块方法相同的矩阵):

A+B=[A11+B11A12+B12A1t+B1tA21+B21A22+B22A2t+B2tAs1+Bs1As2+Bs2Ast+Bst]\bm A+\bm B=\begin{bmatrix} \bm A_{11}+\bm B_{11}&\bm A_{12}+\bm B_{12}&\cdots&\bm A_{1t}+\bm B_{1t}\\ \bm A_{21}+\bm B_{21}&\bm A_{22}+\bm B_{22}&\cdots&\bm A_{2t}+\bm B_{2t}\\ \vdots&\vdots&&\vdots\\ \bm A_{s1}+\bm B_{s1}&\bm A_{s2}+\bm B_{s2}&\cdots&\bm A_{st}+\bm B_{st} \end{bmatrix}

分块数乘运算:

λA=[λA11λA12λA1tλA21λA22λA2tλAs1λAs2λAst]\lambda\bm A=\begin{bmatrix} \lambda\bm A_{11}&\lambda\bm A_{12}&\cdots&\lambda\bm A_{1t}\\ \lambda\bm A_{21}&\lambda\bm A_{22}&\cdots&\lambda\bm A_{2t}\\ \vdots&\vdots&&\vdots\\ \lambda\bm A_{s1}&\lambda\bm A_{s2}&\cdots&\lambda\bm A_{st} \end{bmatrix}

分块乘法运算(对 A\bm A 列的分法和对 B\bm B 行的分法一致):

AB=[C11C12C1rC21C22C2rCs1Cs2Csr]\bm A\bm B=\begin{bmatrix} \bm C_{11}&\bm C_{12}&\cdots&\bm C_{1r}\\ \bm C_{21}&\bm C_{22}&\cdots&\bm C_{2r}\\ \vdots&\vdots&&\vdots\\ \bm C_{s1}&\bm C_{s2}&\cdots&\bm C_{sr} \end{bmatrix}

Cij=k=1tAikBkj(i=1,2,,s;j=1,2,,r)\bm C_{ij}=\sum_{k=1}^t\bm A_{ik}\bm B_{kj}\quad(i=1,2,\cdots,s;j=1,2,\cdots,r)

分块矩阵转置:

AT=[A11TA21TAs1TA12TA22TAs2TA1tTA2tTAstT]\bm A^T=\begin{bmatrix} \bm A_{11}^T&\bm A_{21}^T&\cdots&\bm A_{s1}^T\\ \bm A_{12}^T&\bm A_{22}^T&\cdots&\bm A_{s2}^T\\ \vdots&\vdots&&\vdots\\ \bm A_{1t}^T&\bm A_{2t}^T&\cdots&\bm A_{st}^T \end{bmatrix}

特殊矩阵

以下讨论的特殊矩阵均为方阵。

对角矩阵:

Λ=[λ1λ2λn]\bm\Lambda=\begin{bmatrix}\lambda_1\\&\lambda_2\\&&\ddots&\\&&&\lambda_n\end{bmatrix}

简记为 Λ=diag(λ1,λ2,,λn)\bm\Lambda={\rm diag}(\lambda_1,\lambda_2,\cdots,\lambda_n)

对角矩阵的乘积和幂比较特殊:

AB=BA=[a1b1a2b2anbn]\bm{AB}=\bm{BA}=\begin{bmatrix}a_1b_1\\&a_2b_2\\&&\ddots&\\&&&a_nb_n\end{bmatrix}

Λk=[λ1kλ2kλnk]\bm\Lambda^k=\begin{bmatrix}\lambda_1^k\\&\lambda_2^k\\&&\ddots&\\&&&\lambda_n^k\end{bmatrix}

标量矩阵(对角矩阵的特殊情况):

A=[aaa]\bm A=\begin{bmatrix}a\\&a\\&&\ddots&\\&&&a\end{bmatrix}

上三角形矩阵:

[a11a12a1n0a22a2n00amn]\begin{bmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ 0&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&a_{mn} \end{bmatrix}

下三角形矩阵:

[a1100a21a220am1am2amn]\begin{bmatrix} a_{11}&0&\cdots&0\\ a_{21}&a_{22}&\cdots&0\\ \vdots&\vdots&&\vdots\\ a_{m1}&a_{m2}&\cdots&a_{mn} \end{bmatrix}

上三角矩阵和下三角矩阵可以通过转置互相转换。

对于 nn 阶上(下)三角形矩阵 A,B\bm A,\bm B ,矩阵乘积 AB\bm{AB} (或 BA\bm{BA} )的主对角线元素刚好就是 A,B\bm A,\bm B 相应主对角线元素的乘积:

AB=[a1b1????a2b2?????anbn]\bm{AB}=\begin{bmatrix}a_1b_1&?&?&?\\?&a_2b_2&?&?\\\vdots&\vdots&\ddots&\vdots\\?&?&?&a_nb_n\end{bmatrix}

对称矩阵:

对阵矩阵中关于主对角线对称的两个元素相等:

aij=ajia_{ij}=a_{ji}

对称矩阵转置,矩阵不发生改变: AT=A\bm A^T=\bm A

反称矩阵:

反称矩阵中关于主对角线对称的两个元素相反,并且主对角线上的元素均为零:

aij=ajia_{ij}=-a_{ji}

反称矩阵转置,矩阵中的元素取其相反数: AT=A\bm A^T=-\bm A

任何方阵均可以表示为一个对称矩阵和一个反称矩阵之和。

分块对角矩阵:

一个分块矩阵,其主对角线上的子块全是方阵(阶数可以不同),其余子块均为零矩阵。

分块对角矩阵的性质和对角矩阵的性质类似。

初等变换和初等矩阵

为了解释矩阵的初等变换,我们需要引入同解方程组的概念。考虑一个线性方程组,以下三种操作不会影响方程组最后的解:

  1. 用一个不等于零的数去乘某个方程。
  2. 用一个数去乘某个方程后加到另一个方程上去。
  3. 交换两个方程的位置。

这些操作就被称为线性方程组的初等变换(Elementary transformation),经过初等变换后得到的新方程组和原来的方程组互为同解方程组。

同样的,对于矩阵而言,我们有以下三种初等行变换

  1. 倍法变换:用一个非零的数乘矩阵的某行。
  2. 消法变换:用一个数乘矩阵的某行后再加到另一行上去,
  3. 换法变换:交换矩阵的两行。

矩阵的初等行变换和初等列变换,统称为矩阵的初等变换。

如果矩阵 A\bm A 经过有限次初等变换变成矩阵 B\bm B ,则称矩阵 A,B\bm A,\bm B 等价,记作 AB\bm A\cong\bm B

矩阵之间的等价关系具有如下性质:

  1. 自反性: AA\bm A\cong\bm A
  2. 对称性: 若 AB\bm A\cong\bm B ,则 BA\bm B\cong\bm A
  3. 传递性: 若 AB,BC\bm A\cong\bm B,\bm B\cong\bm C ,则 AC\bm A\cong\bm C

初等矩阵:

对单位矩阵 I\bm I 施加一次初等变换得到的矩阵称为初等矩阵。

用初等矩阵左乘 A\bm A ,相当于对 A\bm A 进行对应的初等行变换;用初等矩阵右乘 A\bm A ,相当于对 A\bm A 进行对应的初等列变换。

初等倍法矩阵:

P(i[k])=[11k11]\bm P(i[k])=\begin{bmatrix}1\\&\ddots\\&&1\\&&&k\\&&&&1\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

初等消法矩阵:

P(i,j[k])=[11k11]\bm P(i,j[k])=\begin{bmatrix}1\\&\ddots\\&&1&\cdots&k\\&&&\ddots&\vdots\\&&&&1\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

初等换法矩阵:

P(i,j)=[101101]\bm P(i,j)=\begin{bmatrix}1\\&\ddots\\&&0&\cdots&1\\&&\vdots&&\vdots\\&&1&\cdots&0\\&&&&&\ddots\\&&&&&&1\end{bmatrix}

标准形矩阵:

任何一个矩阵 Am×n\bm A_{m\times n} 必能经过有限次初等变换化为如下形式:

G=[IrOOO]=[110000]\bm G=\begin{bmatrix}\bm I_r&\bm O\\\bm O&\bm O\end{bmatrix}=\begin{bmatrix}1\\&\ddots\\&&1\\&&&0&\cdots&0\\&&&\vdots&&\vdots\\&&&0&\cdots&0\end{bmatrix}

其中 Ir\bm I_r 的行数为 rr ,则 0rmin{m,n}0\leq r\leq\min\{m,n\}G\bm G 称为矩阵 A\bm A 在初等变换下的标准形,简称标准形矩阵。

在将矩阵变换为标准形的时候,我们会同时用到初等行变换和初等列变换,但大多数时候我们只会使用初等行变换,将矩阵变换为行阶梯形矩阵,它的特点是:

  1. 矩阵的所有元素全为0的行(如果存在的话)都集中在矩阵的最下面;
  2. 每行左起第一个非零元素(称为首非零元)的下方元素全为0。

形如:

[c11c12c1rc1r+1c1n0c22c2rc2r+1c2n00crrcrr+1crn0000000000]\begin{bmatrix} c_{11}&c_{12}&\cdots&c_{1r}&c_{1r+1}&\cdots&c_{1n}\\ 0&c_{22}&\cdots&c_{2r}&c_{2r+1}&\cdots&c_{2n}\\ \vdots&\vdots&&\vdots&\vdots&&\vdots\\ 0&0&\cdots&c_{rr}&c_{rr+1}&\cdots&c_{rn}\\ 0&0&\cdots&0&0&\cdots&0\\ \vdots&\vdots&&\vdots&\vdots&&\vdots\\ 0&0&\cdots&0&0&\cdots&0\\ \end{bmatrix}

行阶梯形任能继续化简为行最简形矩阵

[10c11c1n01cr1crn00000000]\begin{bmatrix} 1&\cdots&0&c_{11}&\cdots&c_{1n}\\ \vdots&&\vdots&\vdots&&\vdots\\ 0&\cdots&1&c_{r1}&\cdots&c_{rn}\\ 0&\cdots&0&0&\cdots&0\\ \vdots&&\vdots&\vdots&&\vdots\\ 0&\cdots&0&0&\cdots&0\\ \end{bmatrix}

显然,行最简形矩阵只要再作适当的初等列变换,就能化为标准形矩阵。

行列式(Determinant)

行列式是一种对于方阵的运算,其运算结果是一个数,设 nn 阶方阵 A=(aij)\bm A=(a_{ij}) ,称

a11a12a1na21a22a2nan1an2ann\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}

方阵 A\bm A 的行列式,记作 A|\bm A|detA\det A

下面,我们主要研究行列式的计算方式及相关性质。

对角线计算法则:

对角线法则适合于计算二阶或三阶这些低阶的行列式:

对于二阶行列式:

a11a12a21a22=a11a22a12a21\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}

对于三阶行列式:

a11a12a13a21a22a23a31a32a33= a11a22a33+a12a23a31+a13a21a32 a13a22a31a12a21a33a11a23a32\begin{vmatrix}a_{11}&a_{12}&a_{13}\\a_{21}&a_{22}&a_{23}\\a_{31}&a_{32}&a_{33}\end{vmatrix}=\begin{matrix}\ \\\quad a_{11}a_{22}a_{33}+a_{12}a_{23}a_{31}+a_{13}a_{21}a_{32}\\-\ a_{13}a_{22}a_{31}-a_{12}a_{21}a_{33}-a_{11}a_{23}a_{32}\end{matrix}

对于高阶行列式而言,我们需要寻找更加通用的解法,这就引出了接下来的内容。

全排列与逆序数

nn 个自然数 1,2,,n1,2,\cdots,n 按照任何一种次序排成的有序数组 j1j2jnj_1j_2\cdots j_n 称为一个 nn排列(Permutation),显然,不重复的 nn 级排列共有 n!n! 个。

若规定从小到大为自然数的标准顺序,则当两个数之间不满足这个顺序时,就称作逆序,一个 nn 级排列所有逆序的总和称为逆序数(Inversion number),记作 τ(j1j2jn)\tau(j_1j_2\cdots j_n)

逆序数的计算方式:对于排列 j1j2jnj_1j_2\cdots j_n ,自 j1j_1 开始直到 jn1j_{n-1} ,逐个计算每个元素的右边比它大的元素的个数 k1,k2,,kn1k_1,k_2,\cdots,k_{n-1} ,则该排列的逆序数为:

τ(j1j2jn)=k1+k2++kn1\tau(j_1j_2\cdots j_n)=k_1+k_2+\cdots+k_{n-1}

我们称逆序数为奇数的排列为奇排列,逆序数为偶数的排列为偶排列,排列中任何两个数的位置对换必然会改变排列的奇偶性。

借助排列的概念,可以定义 nn 行列式 A|\bm A| 的通式:

D=A=j1j2jn(1)τ(j1j2jn)a1j1a2j2anjnD=|\bm A|=\sum_{j_1j_2\cdots j_n}(-1)^{\tau(j_1j_2\cdots j_n)}a_{1j_1}a_{2j_2}\cdots a_{nj_n}

D=A=i1i2in(1)τ(i1i2in)ai11ai22ainnD=|\bm A|=\sum_{i_1i_2\cdots i_n}(-1)^{\tau(i_1i_2\cdots i_n)}a_{i_11}a_{i_22}\cdots a_{i_nn}

此处的 j1j2jn\sum\limits_{j_1j_2\cdots j_n} 表示对所有不同的 nn 阶排列求和,一共是 n!n! 项。

乘积项 a1j1a2j2anjna_{1j_1}a_{2j_2}\cdots a_{nj_n} 称为行列式的一个均匀分布项,简称均布项;
(1)τ(j1j2jn)(-1)^{\tau(j_1j_2\cdots j_n)} 称为该均布项的符号因子,其正负性取决于排列的奇偶性。

现在我们已经可以计算高阶行列式的值了,但排列法还是过于复杂,之后我们会了解一个更加常用且更易于理解的方法。

方阵行列式的性质

  1. 分行/列可加性:

a11a12a1nb1+c1b2+c2bn+cnan1an2ann=a11a12a1nb1b2bnan1an2ann+a11a12a1nc1c2cnan1an2ann\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&\vdots&&\vdots\\ b_1+c_1&b_2+c_2&\cdots&b_n+c_n\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}\\ =\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&\vdots&&\vdots\\ b_1&b_2&\cdots&b_n\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}+\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&\vdots&&\vdots\\ c_1&c_2&\cdots&c_n\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}

  1. 转置不变:A=AT|\bm A|=|\bm A^T|

  2. 若方阵 A\bm A 的第 ii 行(第 jj 列)乘 kk 倍所得得矩阵为 B\bm B ,则 B=kA|\bm B|=k|\bm A|

a11a12a1nkb1kb2kbnan1an2ann=ka11a12a1nb1b2bnan1an2ann\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&\vdots&&\vdots\\ kb_1&kb_2&\cdots&kb_n\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}=k\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ \vdots&\vdots&&\vdots\\ b_1&b_2&\cdots&b_n\\ \vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{vmatrix}

  1. 若方阵 A\bm A 经过一次换法变换化为 B\bm B ,则 B=A|\bm B|=-|\bm A|
    推论:若行列式任意两行/列相同,则行列式为0。
    推论:若行列式任意两行/列对应元素成比例,则行列式为0。

  2. 消法变换不改变行列式的值,即行列式的任意行/列可以乘一个数加到另外一行/列上。

方阵行列式运算规律:

A,B\bm A,\bm Bnn 阶方阵, λ\lambda 为常数, mm 为正整数。

  1. λA=λA|\lambda\bm A|=\lambda|\bm A|
  2. AB=AB|\bm{AB}|=|\bm A||\bm B|
  3. Am=Am|\bm A^m|=|\bm A|^m
  4. I=1|\bm I|=1

拉普拉斯展开(Laplace expansion)

子式:nn 阶方阵行列式 A|\bm A| 中,取部分行列相交形成的阶数 <n<n 的行列式,称作行列式 A|\bm A| 的子式。

余子式(Minor): 把元素 aija_{ij} 所在的行列删除后,留下来的 n1n-1 阶行列式叫做元素 aija_{ij} 的余子式,记作 MijM_{ij} ;把 kk 阶子式 NN 所在的行列删除后,留下来的 nkn-k 阶行列式叫做子式 NN 的余子式,记作 MM

代数余子式(Cofactor):

Aij=(1)i+jMijA_{ij}=(-1)^{i+j}M_{ij}

叫做元素 aija_{ij} 的代数余子式;

A=(1)i1++ik+j1++jkMA=(-1)^{i_1+\cdots+i_k+j_1+\cdots+j_k}M

叫做子式 NN 的代数余子式。(其中 iijj 代表子式所处的行和列的序数)

定理: 对于 A|\bm A| ,其任意一行/列的所有元素与另一行/列对应元素的代数余子式乘积之和等于零,即当 iji\neq j 时,有:

ai1Aj1+ai2Aj2++ainAjn=0a1iA1j+a2iA2j++aniAnj=0a_{i1}A_{j1}+a_{i2}A_{j2}+\cdots+a_{in}A_{jn}=0\\ a_{1i}A_{1j}+a_{2i}A_{2j}+\cdots+a_{ni}A_{nj}=0

拉普拉斯定理:DDnn 阶行列式,在 DD 中取定某 kk(1kn1)(1\leq k\leq n-1) ,则含与此 kk 行中的所有 kk 阶子式与其代数余子式的乘积之和等于 DD

运用拉普拉斯定理,可以将行列式按任意行展开:

A=ai1Ai1+ai2Ai2++ainAini=1,2,,n|\bm A|=a_{i1}A_{i1}+a_{i2}A_{i2}+\cdots+a_{in}A_{in}\qquad i=1,2,\cdots,n

同理,也可以按任意列展开:

A=a1jA1j+a2jA2j++anjAnjj=1,2,,n|\bm A|=a_{1j}A_{1j}+a_{2j}A_{2j}+\cdots+a_{nj}A_{nj}\qquad j=1,2,\cdots,n

例: 计算如下行列式

D2n=abababcdcdcdD_{2n}=\begin{vmatrix}a&&&&&&&b\\&a&&&&&b\\&&\ddots&&&⋰\\&&&a&b\\&&&c&d\\&&⋰&&&\ddots\\&c&&&&&d\\c&&&&&&&d\end{vmatrix}

解:按第一行展开,可以得:

D2n=aab0abcdcd000d+b(1)1+2n0ababcd0cdc00D_{2n}=a\begin{vmatrix}a&&&&&b&0\\&\ddots&&&⋰&&\vdots\\&&a&b&&&\vdots\\&&c&d&&&\vdots\\&⋰&&&\ddots&&\vdots\\c&&&&&d&0\\0&\cdots&\cdots&\cdots&\cdots&0&d\end{vmatrix}+b(-1)^{1+2n}\begin{vmatrix}0&a&&&&&b\\\vdots&&\ddots&&&⋰&\\\vdots&&&a&b&&\\\vdots&&&c&d&&\\\vdots&&⋰&&&\ddots&\\0&c&&&&&d\\c &0&\cdots&\cdots&\cdots&\cdots&0\end{vmatrix}

D2n=adD2(n1)+(1)1+2n(1)2n1+1bcD2(n1)=(adbc)D2(n1)\begin{aligned}D_{2n}&=adD_{2(n-1)}+(-1)^{1+2n}(-1)^{2n-1+1}bcD_{2(n-1)}\\&=(ad-bc)D_{2(n-1)}\end{aligned}

以此作为递推公式,可得:

D2n=(adbc)D2(n1)=(adbc)2D2(n2)=(adbc)n1D2=(adbc)n1abcd=(adbc)n\begin{aligned}D_{2n}&=(ad-bc)D_{2(n-1)}\\ &=(ad-bc)^2D_{2(n-2)}\\ &=(ad-bc)^{n-1}D_2\\ &=(ad-bc)^{n-1}\begin{vmatrix}a&b\\c&d\end{vmatrix}\\ &=(ad-bc)^n\end{aligned}

范德蒙(Vandermonde)行列式:

Dn=111x1x2xnx12x22xn2x1n1x2n1xnn1=1i<jn(xjxi)D_n=\begin{vmatrix}1&1&\cdots&1\\x_1&x_2&\cdots&x_n\\x_1^2&x_2^2&\cdots&x_n^2\\\vdots&\vdots&&\vdots\\x_1^{n-1}&x_2^{n-1}&\cdots&x_n^{n-1}\end{vmatrix}=\prod_{1\leq i<j\leq n}(x_j-x_i)

其中 \prod 表示满足 1i<jn1\leq i<j\leq n 的所有可能的 xjxix_j-x_i 进行连乘。

归纳法证明:当 n=2n=2

D2=11x1x2=x2x1=1i<j2(xjxi)D_2=\begin{vmatrix}1&1\\x_1&x_2\end{vmatrix}=x_2-x_1=\prod_{1\leq i<j\leq 2}(x_j-x_i)

满足该结论。假设该结论对 n1n-1 阶范德蒙行列式成立,即

Dn1=111x2x3xnx22x32xn2x2n2x3n2xnn2=2i<jn(xjxi)D_{n-1}=\begin{vmatrix}1&1&\cdots&1\\x_2&x_3&\cdots&x_n\\x_2^2&x_3^2&\cdots&x_n^2\\\vdots&\vdots&&\vdots\\x_2^{n-2}&x_3^{n-2}&\cdots&x_n^{n-2}\end{vmatrix}=\prod_{2\leq i<j\leq n}(x_j-x_i)

Dn1D_{n-1} 中, i=1i=1 的情况被去除了。

证该结论对 nn 阶行列式成立,将 DnD_n 的第 n1n-1 行的 x1-x_1 倍加到第 nn 行,将第 n2n-2 行的 x1-x_1 倍加到第 n1n-1 行,如此作下去,直到第1行的 x1-x_1 倍加到第2行,得:

Dn=0110x2x1xnx10x2(x2x1)xn(xnx1)0x2n2(x2x1)xnn2(xnx1)D_n=\begin{vmatrix}0&1&\cdots&1\\0&x_2-x_1&\cdots&x_n-x_1\\0&x_2(x_2-x_1)&\cdots&x_n(x_n-x_1)\\\vdots&\vdots&&\vdots\\0&x_2^{n-2}(x_2-x_1)&\cdots&x_n^{n-2}(x_n-x_1)\end{vmatrix}

按第一列展开得:

Dn=x2x1xnx1x2(x2x1)xn(xnx1)x2n2(x2x1)xnn2(xnx1)D_n=\begin{vmatrix}x_2-x_1&\cdots&x_n-x_1\\x_2(x_2-x_1)&\cdots&x_n(x_n-x_1)\\\vdots&&\vdots\\x_2^{n-2}(x_2-x_1)&\cdots&x_n^{n-2}(x_n-x_1)\end{vmatrix}

由行列式的性质可得:

Dn=(x2x1)(x3x1)(xnx1)111x2x3xnx2n2x3n2xnn2=(x2x1)(x3x1)(xnx1)2i<jn(xjxi)=1i<jn(xjxi)\begin{aligned}D_n&=(x_2-x_1)(x_3-x_1)\cdots(x_n-x_1)\begin{vmatrix}1&1&\cdots&1\\x_2&x_3&\cdots&x_n\\\vdots&\vdots&&\vdots\\x_2^{n-2}&x_3^{n-2}&\cdots&x_n^{n-2}\end{vmatrix}\\ &=(x_2-x_1)(x_3-x_1)\cdots(x_n-x_1)\prod_{2\leq i<j\leq n}(x_j-x_i)\\ &=\prod_{1\leq i<j\leq n}(x_j-x_i)\end{aligned}

此处用 (x2x1)(x3x1)(xnx1)(x_2-x_1)(x_3-x_1)\cdots(x_n-x_1) 连乘补全了 i=1i=1 的情况。

根据数学归纳法,可证得范德蒙行列式结论在 n2n\geq 2 时成立。

AB型行列式:

除了对角线是 bb 其余全是 aa 的行列式:

baaabaaab\begin{vmatrix} b&a&\cdots&a\\ a&b&\cdots&a\\ \vdots&\vdots&&\vdots\\ a&a&\cdots&b \end{vmatrix}

将除第1行以外每一行都加到第1行上,得:

b+(n1)ab+(n1)ab+(n1)aabaaab\begin{vmatrix} b+(n-1)a&b+(n-1)a&\cdots&b+(n-1)a\\ a&b&\cdots&a\\ \vdots&\vdots&&\vdots\\ a&a&\cdots&b \end{vmatrix}

由行列式性质可转化为:

[b+(n1)a]111abaaab[b+(n-1)a]\begin{vmatrix} 1&1&\cdots&1\\ a&b&\cdots&a\\ \vdots&\vdots&&\vdots\\ a&a&\cdots&b \end{vmatrix}

将第1行乘 (a)(-a) 加到下面各行上,得:

[b+(n1)a]1110ba000ba=[b+(n1)a]ba00ba[b+(n-1)a]\begin{vmatrix} 1&1&\cdots&1\\ 0&b-a&\cdots&0\\ \vdots&\vdots&&\vdots\\ 0&0&\cdots&b-a \end{vmatrix}=[b+(n-1)a]\begin{vmatrix} b-a&\cdots&0\\ \vdots&&\vdots\\ 0&\cdots&b-a \end{vmatrix}

可得AB型行列式通式:

b+(n1)ab+(n1)ab+(n1)aabaaab=[b+(n1)a](ba)n1\begin{vmatrix} b+(n-1)a&b+(n-1)a&\cdots&b+(n-1)a\\ a&b&\cdots&a\\ \vdots&\vdots&&\vdots\\ a&a&\cdots&b \end{vmatrix}=[b+(n-1)a](b-a)^{n-1}

加边法:

加边法是对拉普拉斯展开的逆用,用加边法可以求如下行列式:

x1a2ana1x2ana1a2xn\begin{vmatrix} x_1&a_2&\cdots&a_n\\ a_1&x_2&\cdots&a_n\\ \vdots&\vdots&&\vdots\\ a_1&a_2&\cdots&x_n \end{vmatrix}

在行列式左侧加边,可将原式转化为:

1a1a2an0x1a2an0a1x2an0a1a2xn\begin{vmatrix} 1&-a_1&-a_2&\cdots&-a_n\\ 0&x_1&a_2&\cdots&a_n\\ 0&a_1&x_2&\cdots&a_n\\ \vdots&\vdots&\vdots&&\vdots\\ 0&a_1&a_2&\cdots&x_n \end{vmatrix}

将第1行加到下面各行上,得:

1a1a2an1x1a10010x2a20100xnan\begin{vmatrix} 1&-a_1&-a_2&\cdots&-a_n\\ 1&x_1-a_1&0&\cdots&0\\ 1&0&x_2-a_2&\cdots&0\\ \vdots&\vdots&\vdots&&\vdots\\ 1&0&0&\cdots&x_n-a_n \end{vmatrix}

这种形状的行列式被称作“爪型行列式”,求解爪型行列式:

i=1n(xiai)1a1a2an1x1a11001x2a20101xnan001\prod_{i=1}^n(x_i-a_i)\begin{vmatrix} 1&-a_1&-a_2&\cdots&-a_n\\ \dfrac{1}{x_1-a_1}&1&0&\cdots&0\\ \dfrac{1}{x_2-a_2}&0&1&\cdots&0\\ \vdots&\vdots&\vdots&&\vdots\\ \dfrac{1}{x_n-a_n}&0&0&\cdots&1 \end{vmatrix}

各行乘 (ai)(-a_i) 加到第1行:

i=1n(xiai)1+i=1naixiai0001x1a11001x2a20101xnan001=i=1n(xiai)(1+i=1naixiai)\prod_{i=1}^n(x_i-a_i)\begin{vmatrix} 1+\sum\limits_{i=1}^n\dfrac{a_i}{x_i-a_i}&0&0&\cdots&0\\ \dfrac{1}{x_1-a_1}&1&0&\cdots&0\\ \dfrac{1}{x_2-a_2}&0&1&\cdots&0\\ \vdots&\vdots&\vdots&&\vdots\\ \dfrac{1}{x_n-a_n}&0&0&\cdots&1 \end{vmatrix}=\prod_{i=1}^n(x_i-a_i)\left(1+\sum_{i=1}^n\frac{a_i}{x_i-a_i}\right)

矩阵的逆

A\bm Ann 阶方阵,若存在 nn 阶方阵 B\bm B ,使得

AB=BA=I\bm{AB}=\bm{BA}=\bm I

则称 A\bm A 可逆,且 B\bm BA\bm A 的逆矩阵,简称 A\bm A逆(Inverse),记作 B=A1\bm B=\bm A^{-1}

一般而言,我们只讨论方阵的逆。

可逆矩阵又称非奇异矩阵(Nonsingular matrix),不可逆矩阵又称奇异矩阵(Singular matrix)

易证初等矩阵都是可逆矩阵:

  1. P(i[k])1=P(i[1k])\bm P(i[k])^{-1}=\bm P(i[\frac{1}{k}])
  2. P(i,j[k])1=P(i,j[k])\bm P(i,j[k])^{-1}=\bm P(i,j[-k])
  3. P(i,j)1=P(i,j)\bm P(i,j)^{-1}=\bm P(i,j)

可逆矩阵基本性质:

  1. 可逆矩阵的逆是唯一的。
  2. A\bm A 可逆,则 (A1)1=A(\bm A^{-1})^{-1}=\bm A
  3. A\bm A 可逆,数 λ0\lambda\neq 0 ,则 λA\lambda\bm A 可逆,且 (λA)1=1λA1(\lambda\bm A)^{-1}=\frac{1}{\lambda}\bm A^{-1}
  4. A\bm A 可逆,则 AT\bm A^T 可逆,且 (AT)1=(A1)T(\bm A^T)^{-1}=(\bm A^{-1})^T
  5. nn 阶方阵 A,B\bm A,\bm B 皆可逆,则 AB\bm{AB} 可逆,且 (AB)1=B1A1(\bm{AB})^{-1}=\bm B^{-1}\bm A^{-1}
    推广:若 nn 阶方阵 A1,A2,,As\bm A_1,\bm A_2,\cdots,\bm A_s 皆可逆,则它们的乘积 A1A2As\bm A_1\bm A_2\cdots\bm A_s 也可逆,且

(A1A2As)1=As1A21A11(\bm A_1\bm A_2\cdots\bm A_s )^{-1}=\bm A_s^{-1}\cdots\bm A_2^{-1}\bm A_1^{-1}

  1. 规定 Am=(Am)1=(A1)m\bm A^{-m}=(\bm A^m)^{-1}=(\bm A^{-1})^m
  2. 可逆矩阵的行列式 A1=1A|\bm A^{-1}|=\dfrac{1}{|\bm A|}

伴随矩阵求逆矩阵

nn 阶方阵每一个元素求其代数余子式 AijA_{ij} ,填写在原来的位置,然后再进行转置,可以写出如下方阵:

[A11A21An1A12A22An2A1nA2nAnn]\begin{bmatrix} A_{11}&A_{21}&\cdots&A_{n1}\\ A_{12}&A_{22}&\cdots&A_{n2}\\ \vdots&\vdots&&\vdots\\ A_{1n}&A_{2n}&\cdots&A_{nn} \end{bmatrix}

这个方阵就被称作 A\bm A伴随矩阵(Adjugate matrix,the adjoint of a matrix),记作 A\bm A^*adj A\text{adj}\ \bm A

由代数余子式定理我们可以推出,矩阵与其伴随矩阵乘积的关系:

AA=AA=AI\bm{AA}^*=\bm A^*\bm A=|\bm A|\bm I

A\bm A 可逆时,存在逆矩阵 A1\bm A^{-1} 使得 AA1=I\bm{AA}^{-1}=\bm I ,两边取行列式,得

AA1=1|\bm A||\bm A^{-1}|=1

因此必然有 A0|\bm A|\neq 0 。又因为 AA=AI\bm{AA}^*=|\bm A|\bm I ,可得

A1=1AA\bm A^{-1}=\frac{1}{|\bm A|}\bm A^*

综上,我们找到了用伴随矩阵求逆矩阵的方法。

矩阵可逆定理:

  1. 方阵 A\bm A 可逆的充要条件是 A0|\bm A|\neq 0

  2. 对于 nn 阶矩阵 A,B\bm A,\bm B ,只要有 AB=I\bm{AB}=\bm I ,则矩阵 A,B\bm A,\bm B 皆可逆且互为逆。

  3. 方阵 A\bm A 可逆的充要条件是 A\bm A 可以经过有限次初等变换化为单位矩阵。

  4. 方阵 A\bm A 可逆的充要条件是 A\bm A 可以表示为有限个初等矩阵的乘积。

  5. 方阵 A\bm A 可逆的充要条件是可以只经过初等行变换化为单位矩阵。

借助矩阵的逆和初等变换的关系,可以用初等变换求逆:

[AI]elementary[IA1]\begin{bmatrix}\bm A&\bm I\end{bmatrix}\xrightarrow{elementary}\begin{bmatrix}\bm I&\bm A^{-1}\end{bmatrix}

伴随矩阵基本性质:

  1. A=AA1=AnA=An1|\bm A^*|=||\bm A|\bm A^{-1}|=\dfrac{|\bm A|^{n}}{|\bm A|}=|\bm A|^{n-1}
  2. (A)1=(AA1)1=AA(\bm A^*)^{-1}=(|\bm A|\bm A^{-1})^{-1}=\dfrac{\bm A}{|\bm A|}
  3. (A)T=(AA1)T=AT(AT)1=(AT)(\bm A^*)^T=(|\bm A|\bm A^{-1})^T=|\bm A^T|(A^T)^{-1}=(\bm A^T)^*
  4. (kA)=kA(kA)1=knA1kA1=kn1A(k\bm A)^*=|k\bm A|(k\bm A)^{-1}=k^n|\bm A|\dfrac{1}{k}\bm A^{-1}=k^{n-1}\bm A^*
  5. (A)=A(A)1=AA1(AA1)1=An1AA=An2A(\bm A^*)^*=|\bm A^*|(\bm A^*)^{-1}=||\bm A|\bm A^{-1}|(|\bm A|\bm A^{-1})^{-1}=|\bm A|^{n-1}\dfrac{\bm A}{|\bm A|}=|\bm A|^{n-2}\bm A
  6. (AB)=ABAB1=ABB1A1=BB1AA1=BA(\bm{AB})^*=|\bm{AB}|\bm{AB}^{-1}=|\bm A||\bm B|\bm B^{-1}\bm A^{-1}=|\bm B|\bm B^{-1}|\bm A|\bm A^{-1}=\bm B^*\bm A^*

广义逆矩阵

左逆和右逆:

以上我们的求逆都是对于方阵而言的,这种逆被称作两侧逆,而非方阵则不拥有两侧逆,只能分情况讨论其左逆和右逆。

对于 m×n(mn)m\times n(m\neq n) 的矩阵:

m>nm>n 时,ATA\bm A^T\bm A 是一个 n×nn\times n 的方阵,则可以讨论 ATA\bm A^T\bm A 的逆,此时

(ATA)1ATA=I(\bm A^T\bm A)^{-1}\bm A^T\bm A=\bm I

Aleft1=(ATA)1AT\bm A_{left}^{-1}=(\bm A^T\bm A)^{-1}\bm A^T ,则

Aleft1A=I\bm A_{left}^{-1}\bm A=\bm I

Aleft1\bm A_{left}^{-1}A\bm A 的左逆。

同理,当 m<nm<n 时,AAT\bm A\bm A^T 是一个 m×mm\times m 的方阵,则可以讨论 AAT\bm A\bm A^T 的逆,此时

AAT(AAT)1=I\bm A\bm A^T(\bm A\bm A^T)^{-1}=\bm I

Aright1=AT(AAT)1\bm A_{right}^{-1}=\bm A^T(\bm A\bm A^T)^{-1} ,则

AAright1=I\bm A\bm A_{right}^{-1}=\bm I

Aright1\bm A_{right}^{-1}A\bm A 的右逆。

伪逆矩阵:

对于奇异矩阵,我们无法对其进行常规求逆,此时只能对其求伪逆(Pseudo-inverse),记作 A+\bm A^+ ,此处不讲解其具体来由和定义,只简单提一下其求法。

A\bm A 的伪逆是对超定线性方程组 Ax=b\bm Ax=b 求其最小二乘解,定义为:

A+=lima(ATA+aI)1AT\bm A^+=\lim_{a\to\infty}(\bm A^T\bm A+a\bm I)^{-1}\bm A^T

对于实矩阵,可以用奇异值分解法(Singular Vector Decomposite,SVD) 求其伪逆:

A=UWVT\bm A=\bm U\bm W\bm V^T

奇异值分解法

其中

AAT=U[D000]UT\bm{AA}^T=\bm U\begin{bmatrix}\bm D&0\\0&0\end{bmatrix}\bm U^T

ATA=V[D000]VT\bm A^T\bm A=\bm V\begin{bmatrix}\bm D&0\\0&0\end{bmatrix}\bm V^T\\

用以下公式求伪逆:

A+=VD+UT\bm A^+=\bm V\bm D^+\bm U^T

伪逆矩阵的性质:

  1. AA+A=A\bm A\bm A^+\bm A=\bm A
  2. A+AA+=A+\bm A^+\bm A\bm A^+=\bm A^+
  3. AA+=(AA+)T\bm A\bm A^+=(\bm A\bm A^+)^T
  4. A+A=(A+A)T\bm A^+\bm A=(\bm A^+\bm A)^T