行列式与矩阵理论入门

· · 算法·理论

前言

这篇文章介绍基础的线性空间、行列式和矩阵理论。

本文尝试使用更高观点和一般性的视角介绍矩阵相关内容,例如从全矩阵环入手统观矩阵的结构和运算,以模引入线性空间,由同态基本定理得到秩和线性方程组解空间的定理,充分体现掌握理论的重要性和简洁优美。OI 中有关线性代数的博客较少,尤其是缺乏一个系统的阐述,这篇博客可能有助于一定程度上弥补这点。

线性代数是研究线性空间及其态射的学问。本文的前半部分以线性空间与线性变换(矩阵)的基本理论为纲,在这个骨架下编织基础线性空间及矩阵理论的大网。“全矩阵环基础”从环论切入介绍矩阵的整体结构和基本运算,“矩阵与线性空间”则从线性空间及其映射的视角介绍矩阵理论及线性代数中最为重要的两个定理——线性映射的同态基本定理和秩-零化度定理。这两部分内容在全文是统领性的,有了线性映射这一工具,接下来介绍研究矩阵的一般方法,则是水到渠成、清晰简明了。

行列式在文章的前半部分主要作为表示矩阵的秩的工具,因此一些其他的例子,如范德蒙德矩阵、拉格朗日插值、朗斯基行列式、主对角行列式等被放在文章末尾补充叙述。这些例子体现了行列式的广泛应用,读者也应当有所了解。

本文的前置及补充:

目录

行列式

$$ \det{\boldsymbol A}=\sum_{j_1j_2\cdots j_n}(-1)^{\tau(j_1j_2\cdots j_n)}a_{1j_1}a_{2j_2}\cdots a_{nj_n}, $$ 其中 $\tau$ 为排列的逆序对数。众所周知转置矩阵的行列式与原矩阵相等。事实上,该结论可以推广为一个基本性质。 ${\bf Theorem\;1.1.2\quad}n$ 阶方阵 $\bf A$ 的行列式可以展开为 $$ \begin{aligned} \det{\boldsymbol A}&=\sum_{k_1k_2\cdots k_n}(-1)^{\tau(i_1i_2\cdots i_n)+\tau(k_1k_2\cdots k_n)}a_{i_1k_1}a_{i_2k_2}\cdots a_{i_nk_n}\\ \det{\boldsymbol A}&=\sum_{i_1i_2\cdots i_n}(-1)^{\tau(i_1i_2\cdots i_n)+\tau(k_1k_2\cdots k_n)}a_{i_1k_1}a_{i_2k_2}\cdots a_{i_nk_n}, \end{aligned} $$ 其中分别指定行指标的一个排列 $i_1\cdots i_n$ 和列指标的一个排列 $k_1\cdots k_n$。 $Proof.\quad$证明是平凡的,只需考察 $a_{1j_1}a_{1j_2}\cdots a_{1j_n}$ 互换 $s$ 次元素变成 $a_{i_1k_1}a_{i_2k_2}\cdots a_{i_nk_n}$ 后逆序数的变化即可。 $\bf Proposition\;1.1.3\sim1.1.7

在 OI 中,利用该五条性质即可对行列式消元求解。

行列式一行展开

$$ A_{ij}=(-1)^{i+j}M_{ij}, $$ 称 $A_{ij}$ 为 $\bf A$ 的一个**代数余子式**。 ${\bf Theorem\;1.2.2\quad} n$ 级矩阵 ${\boldsymbol A}$ 的行列式等于第 $i$ 行元素与自己的代数余子式的乘积之和,即 $$ |{\boldsymbol A}|=\sum_{j=1}^na_{ij}A_{ij}. $$ $Proof.\quad$由定理 $1.1.2$,行列式可写为 $$ \begin{aligned}\sum_{k_1\cdots k_{i-1}jk_{i+1}\cdots k_n}&(-1)^{\tau(k_1\cdots k_{i-1}jk_{i+1}\cdots k_n)}a_{1k_1}\cdots a_{i-1,k_{i-1}}a_{ij}a_{i_1k_{i+1}}\cdots a_{nk_n}\\ &=\sum_{jk_1\cdots k_{i-1}k_{i+1}\cdots k_n}(-1)^{\tau(i1\dots(i-1)(i+1)\dots)+\tau(jk_1\cdots k_{i-1}k_{i+1}\cdots k_n)}a_{ij}a_{1k_1}\cdots a_{nk_n}\\ &=\sum_{j=1}^na_{ij}(-1)^{i-1}(-1)^{j-1}\sum_{k_1\cdots k_{i-1}k_{i+1}\cdots k_n}(-1)^{\tau(k_1\cdots k_n)}a_{1k_1}\cdots a_{nk_n}\\ &=\sum_{j=1}^na_{ij}(-1)^{i+j}\begin{vmatrix}a_{11}&\cdots&a_{1,j-1}&a_{1,j+1}&\cdots&a_{1n}\\\vdots&&\vdots&\vdots&&\vdots\\a_{i-1,1}&\cdots&a_{i-1,j-1}&a_{i-1,j+1}&\cdots&a_{i-1,n}\\a_{i+1,1}&\cdots&a_{i+1,j-1}&a_{i+1,j+1}&\cdots&a_{i+1,n}\\\vdots&&\vdots&\vdots&&\vdots\\a_{n1}&\cdots&a_{n,j-1}&a_{n,j+1}&\cdots&a_{nn}\end{vmatrix}=\sum_{j=1}^na_{ij}A_{ij}.\quad\square\end{aligned} $$ 对于选定两行 $i,k$ 并对 $a_{ij}A_{kj}$ 求和,我们只需将矩阵第 $k$ 行替换为第 $i$ 行,这样便转化为了对 $a_{kj}A_{kj}$ 的求和,结果即为替换后的矩阵的行列式值。当 $i\neq k$ 时,由于其有两行相同,所以值为零。又由于行列式的行列地位等价(定理 $1.2.2$),我们得到如下推论。 $\bf Corollary\;1.2.3 \begin{aligned} \sum_{j=1}^na_{ij}A_{kj}&=\begin{cases}|{\boldsymbol A}|&k=i\\0&k\neq i\end{cases}\\ \sum_{i=1}^na_{ij}A_{il}&=\begin{cases}|{\boldsymbol A}|&l=j\\0&l\neq j\end{cases} \end{aligned}

拉普拉斯定理

k 阶子式

所谓 \boldsymbol k 阶子式是指选定 \boldsymbol Aki_1,\cdots,i_kkj_1,\cdots,j_k,由着 kk 列相交的元素组成的方阵的行列式,记作

\boldsymbol A\begin{pmatrix}i_1,i_2,\cdots,i_k\\j_1,j_2,\cdots,j_k\end{pmatrix}:=\begin{vmatrix} a_{i_1j_1}&a_{i_1j_2}&\cdots&a_{i_1j_k}\\ a_{i_2j_1}&a_{i_2j_2}&\cdots&a_{i_2j_k}\\ \vdots&\vdots&\ddots&\vdots\\ a_{i_kj_1}&a_{i_kj_2}&\cdots&a_{i_kj_k} \end{vmatrix},

而其对应的余子式即为将 \boldsymbol A 划去这 kk 列后组成的矩阵的行列式。于是设余下的行与列为 i'_1,\cdots,i'_{n-k}j'_1,\cdots,j'_{n-k}。显然余子式是一个 n-k 阶子式,它等于

\boldsymbol A\begin{pmatrix}i'_1,i'_2,\cdots,i'_{n-k}\\j'_1,j'_2,\cdots,j'_{n-k}\end{pmatrix},

所说的 k 阶子式的代数余子式则是

(-1)^{(i_1+\cdots+i_k)+(j_1+\cdots+j_k)}\boldsymbol A\begin{pmatrix}i'_1,i'_2,\cdots,i'_{n-k}\\j'_1,j'_2,\cdots,j'_{n-k}\end{pmatrix}.

可自行对照 1 阶子式的代数余子式,它是我们早先已熟知的。需要注意,这里 \{i\},\,\{j\},\,\{i'\},\,\{j'\} 都是没有顺序的,等价地,它们皆从小到大排列。

矩阵 \boldsymbol A 的一个 r主子式是它的一个行指标与列指标相同的 r 阶子式

\boldsymbol A\begin{pmatrix} i_1,i_2,\cdots,i_r\\ i_1,i_2,\cdots,i_r \end{pmatrix}.

多行展开定理

Laplace 定理是行列式的 k 行展开定理,它表明任选 \boldsymbol Ak 行,则 \det\boldsymbol A 为由此产生的所有 k 阶子式与其对应 k 阶代数余子式之积的和,亦即如下定理。

$$ |{\boldsymbol A}|=\sum_{1<j_1\leqslant\dots<j_k\leqslant n}\boldsymbol A\begin{pmatrix}i_1,i_2,\cdots,i_k\\j_1,j_2,\cdots,j_k\end{pmatrix}(-1)^{\left(\sum_{x}i_x\right)+\left(\sum_{x}j_x\right)}\boldsymbol A\begin{pmatrix}i'_1,i'_2,\cdots,i'_{n-k}\\j'_1,j'_2,\cdots,j'_{n-k}\end{pmatrix} $$ $\mathbf{Corollary\;1.2.5}\quad \begin{vmatrix} a_{11}&\cdots&a_{1k}&0&\cdots&0\\ \vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\ a_{k1}&\cdots&a_{kk}&0&\cdots&0\\ c_{11}&\cdots&c_{1k}&b_{11}&\cdots&b_{1r}\\ \vdots&\ddots&\vdots&\vdots&\ddots&\vdots\\ c_{r1}&\cdots&c_{rk}&b_{r1}&\cdots&b_{rr}\\ \end{vmatrix}= \begin{vmatrix} a_{11}&\cdots&a_{1k}\\ \vdots&\ddots&\vdots\\ a_{k1}&\cdots&a_{kk} \end{vmatrix}{\;\cdot\;} \begin{vmatrix} b_{11}&\cdots&b_{1r}\\ \vdots&\ddots&\vdots\\ b_{r1}&\cdots&b_{rr} \end{vmatrix} ## 克拉默法则 $\mathbf{Theorem\;1.3\;(Cramer's\;rule)}\quad$线性方程组有唯一解当且仅当 $\operatorname{det}A\neq 0$,且其解为 $$ \left(\frac{|\boldsymbol B_1|}{|\boldsymbol A|},\frac{|\boldsymbol B_2|}{|\boldsymbol A|},\cdots,\frac{|\boldsymbol B_n|}{|\boldsymbol A|}\right)'. $$ $Proof. \begin{aligned} \sum_{j=1}^na_{ij}\frac{|\boldsymbol B_j|}{|\boldsymbol A|}&=\frac{1}{|\boldsymbol A|}\sum_{j=1}^na_{ij}\left|\boldsymbol B_j\right|\\ &=\frac{1}{|\boldsymbol A|}\sum_{j=1}^na_{ij}\left(\sum_{k=1}^nb_kA_{kj}\right)\\ &=\frac{1}{|\boldsymbol A|}\sum_{k=1}^nb_k\left(\sum_{j=1}^na_{ij}A_{kj}\right) &=\frac{1}{|\boldsymbol A|}b_i\left|\boldsymbol A\right|=b_i \end{aligned}

全矩阵环基础

概述

记域 Fn 级矩阵的集合为 M_n(F),我们有

因此 (M_n(F),+,\cdot) 构成了一个环,称其为全矩阵环。这里只说明乘法结合律:设 \boldsymbol{AB}=\boldsymbol D,直接展开得等式两端皆为

[\boldsymbol D](i;j)=\sum_{k=1}^n\sum_{l=1}^ma_{ik}b_{kl}c_{lj}.

显然 M_n(F) 不是交换环。

\bf Definition\;2.1.1\sim2.1.3

下面我们讨论该环的一些基本性质,如其元素何时可逆,以及幂等元、零因子、幂零元等。其中有些内容则需要借助线性空间及其变换的视角来解决,这会在之后讨论。

可逆矩阵

下面介绍可逆矩阵和一般环上的可逆元,并基于现有工具给出逆矩阵的两个求解方法。

$\bf Proposition\;2.2.2\quad$矩阵的逆是唯一的。 $Proof.\quad$设 $\boldsymbol B_1$ 亦是 $\boldsymbol A$ 的逆,则 $\boldsymbol B=\boldsymbol{BAB_1}=\boldsymbol B_1$。 $\bf Proposition\;2.2.3\quad$若矩阵 ${\boldsymbol A}$ 为零因子,则它不可逆。特别地,若 ${\boldsymbol A}$ 幂零,则它不可逆。 $Proof.\quad$零因子条件暗含有另一非零矩阵 ${\boldsymbol B}$ 与之相乘为零矩阵。双边皆乘上 ${\boldsymbol A}$ 的逆,得到 ${\boldsymbol B=0}$,这就产生了矛盾。所以 ${\boldsymbol A}$ 不可逆。特别地,幂零矩阵一定是零因子,所以也不可逆。 以上两个结论皆可推广到一般的环中。 ### 伴随矩阵法 $\bf Definition\;2.2.4\quad$ 设 ${\boldsymbol A}=(a_{ij})$,并设 $A_{ij}$ 为其代数余子式,那么 $$ {\boldsymbol A}^*=\begin{pmatrix} A_{11}&A_{21}&\cdots&A_{n1}\\ A_{12}&A_{22}&\cdots&A_{n2}\\ \cdots&\vdots&\ddots&\vdots\\ A_{1n}&A_{2n}&\cdots&A_{nn} \end{pmatrix}. $$ 称为 ${\boldsymbol A}$ 的**伴随矩阵**。 现在运用行列式的一行展开定理;我们将 ${\boldsymbol A}$ 与 ${\boldsymbol A}^*$ 相乘,得到 $$ \begin{aligned} {\boldsymbol A}{\boldsymbol A}^*&=\begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \cdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{pmatrix}\begin{pmatrix} A_{11}&A_{21}&\cdots&A_{n1}\\ A_{12}&A_{22}&\cdots&A_{n2}\\ \cdots&\vdots&\ddots&\vdots\\ A_{1n}&A_{2n}&\cdots&A_{nn} \end{pmatrix}\\ &=\begin{pmatrix} |{\boldsymbol A}|&0&\cdots&0\\ 0&|{\boldsymbol A}|&\cdots&0\\ \cdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&|{\boldsymbol A}| \end{pmatrix}=\left|{\boldsymbol A}\right|{\boldsymbol I}. \end{aligned} $$ 类似可得 ${\boldsymbol A}^*{\boldsymbol A}=\left|{\boldsymbol A}\right|{\boldsymbol I}$。综合便得到矩阵可逆元的定理。 ${\bf Theorem\;2.2.5\quad}n$ 级矩阵 ${\boldsymbol A}$ 可逆的充分必要条件是 $\left|{\boldsymbol A}\right|\neq 0$,且 $$ {\boldsymbol A}^{-1}=\frac{1}{\left|{\boldsymbol A}\right|}{\boldsymbol A}^*. $$ ### 矩阵多项式法 对于形如 $\boldsymbol A=a\boldsymbol I-k\boldsymbol B$ 的矩阵,其中 $\boldsymbol B$ 是幂零指数小于 $n$ 的幂零矩阵,我们可根据 $$ \begin{aligned} \left(\boldsymbol I-\frac{k}{a}\boldsymbol B\right)\left(\boldsymbol I+\frac{k}{a}\boldsymbol B+\frac{k^2}{a^2}\boldsymbol B^2+\cdots+\frac{k^{n-1}}{a^{n-1}}\boldsymbol B^{n-1}\right)&=\boldsymbol I-\frac{k^n}{a^n}\boldsymbol B^n\\ \left(a\boldsymbol I-k\boldsymbol B\right)\left(\frac{1}{a}\boldsymbol I+\frac{k}{a^2}\boldsymbol B+\frac{k^2}{a^3}\boldsymbol B^2+\cdots+\frac{k^{n-1}}{a^{n}}\boldsymbol B^{n-1}\right)&=\boldsymbol I \end{aligned} $$ 得到 $$ \boldsymbol A^{-1}=\frac{1}{a}\sum_{i=0}^{n-1}\left(\frac{k}{a}\boldsymbol B\right)^i. $$ ------------ # 矩阵与线性空间 ## 线性空间与线性变换 通过**模**来引入线性空间的概念。 $\mathbf{Definition\;3.1.1\sim3.1.2}\quad$设 $R$ 为交换环,其上的一个 $\mathbf{R}\text -$**模** $M$ 是作用之的一个交换群,备有映射 $R\times M\to M,(r,m)\mapsto rm$,满足 $\forall r,s\in R,m,n\in M$: - $r(sm)=(rs)m

如果一个模同构于一系列 R 的一个直和 R^n,则其为一个自由 \mathbf R\text -,称 n 为其,并认为其有一个给出的,称之为所谓坐标向量集:

(1,0,0,\dots,0),\,(0,1,0,\dots,0),\,\dots,\,(0,\dots,0,1) 一言以蔽之,线性空间就是域作用的交换群。 $\bf Definition\;3.1.4\quad$设 $V$ 是域 $F$ 上的线性空间,如果映射 $$ \begin{aligned} \mathcal A:V&\longrightarrow V\\ \alpha&\longmapsto\mathcal A\alpha \end{aligned} $$ 满足 $$ \begin{aligned} \mathcal A(\alpha+\beta)&=\mathcal \alpha+v\beta\qquad\forall\alpha,\beta\in V,\\ \mathcal A(k\alpha)&=k\mathcal A\alpha\qquad\quad\forall\alpha\in V,\,k\in F, \end{aligned} $$ 那么称 $\mathcal A$ 是 $V$ 上的一个**线性变换**。 ### 作为线性空间的矩阵集合 对于域 $F$ 上的全体 $s\times n$ 矩阵 $M_{s\times n}(F)$,以下性质是显然的: - 关于加法的交换律和结合律。 - 零元素 $\bf 0$ 和负元素 $\mathbf{-A}$。 - 关于数乘的幺元:$\exists e\in F$,使得 $\forall\boldsymbol A\in M_{s\times n}(F)$ 均有 $1\boldsymbol A=\boldsymbol A$。 - 关于数乘的结合律:$(kl)\boldsymbol A=k(l\boldsymbol A)$。 - 数乘的线性性(分配律):$(k+l)\boldsymbol A=k\boldsymbol A+l\boldsymbol A,\,k(\boldsymbol A+\boldsymbol B)=k\boldsymbol A+k\mathbf B$。 这样 $(M_{s\times n}(F),+_X,\cdot_F)$ 就成为了一个线性空间。 注意到 $\dim M_{s\times n}(F)=sn$,其中一个基就是 $(\boldsymbol E_{ij})_{i\leqslant s,n\leqslant n} \begin{aligned} \boldsymbol E_{ij}&=\begin{pmatrix}0&\cdots&0&\cdots&0\\\vdots&\ddots&\vdots&\ddots&\vdots\\0&\cdots&1_{i,j}&\cdots&0\\\vdots&\ddots&\vdots&\ddots&\vdots\\0&\cdots&0&\cdots&0\end{pmatrix},\\ \boldsymbol A&=\sum_{i=1}^s\sum_{j=1}^n\boldsymbol E_{ij}a_{ij.} \end{aligned}

商空间与同态基本定理

接下来的这几部分给出的定理可谓是整个线性代数中最为重要的,读者应当牢记。

群同态基本定理

基于线性空间是域作用的交换群这一概念,我们先来证明群同态基本定理即第一同构定理。

$\bf Lemma.\quad$设 $\varphi:M\to M'$ 是满同态,定义 $x\sim y\iff\varphi(x)=\varphi(y)$,则诱导同态 $\overline\varphi:(M/\sim)\to M'$ 是同构。 $Proof.\quad$因 $\varphi$ 是满的,故从 $\sim$ 的定义知其为同构。$\square $$ \begin{aligned} G_1&\to \,G_1/\ker(\varphi)&\!\!\!\sim\,\operatorname{im}(\varphi)\\ g&\mapsto \;\,g\cdot\ker(\varphi)&\!\!\!\mapsto\varphi(g)\,\,\,\, \end{aligned} $$ 即所谓**同态基本定理**。 $Proof.\quad$商映射必定是是满的,右端同构由引理一望可知。$\square

秩-零化度定理

上述对群同态的核与象的同构定理(群运算取加法 +)加上域的作用,就得到了以下线性映射的核与象的定理。

$$ \begin{aligned} \sigma:\quad V/\ker\mathcal A&\longrightarrow\operatorname{Im}\mathcal A\\ \alpha+\ker\mathcal A&\longmapsto\mathcal A\alpha \end{aligned} $$ 乃是同构,即 $$ V/\ker\mathcal A\cong\operatorname{Im}\mathcal A. $$ $Proof.\quad$加上域作用后的证明与之类似,可直观地写出。$\square

我们不妨做一些更细致的讨论。上述定理表明

\dim(V/\ker\mathcal A)=\dim\operatorname{Im}\mathcal A,

也即下述秩-零化度定理。

\bf Theorem\;3.2.4 \dim\ker\mathcal A+\dim\operatorname{Im}\mathcal A=\dim V.

\dim\ker\mathcal A\mathcal A零化度\dim\operatorname{Im}\mathcal A 称为 \mathcal A。于是秩-零化度定理表明秩加上零化度等于 V 的维数。

解空间与 F^n 上的秩-零化度定理

\boldsymbol A 是域 F 上的 n 级矩阵,设 \boldsymbol\alpha_1,\boldsymbol\alpha_2,\cdots,\boldsymbol\alpha_n 是其列向量,对于列向量 \boldsymbol x\in F^n,有

\boldsymbol A\boldsymbol x=(\boldsymbol\alpha_1,\boldsymbol\alpha_2,\cdots,\boldsymbol\alpha_n)\boldsymbol x=\boldsymbol\alpha_1x_1+\boldsymbol\alpha_2x_2+\cdots+\boldsymbol\alpha_nx_n,

这表明 \boldsymbol A 就是一个 F^n 上的线性变换,映 \boldsymbol x\mapsto\boldsymbol A\boldsymbol x。则根据秩-零化度定理

\dim\ker\boldsymbol A+\dim\operatorname{Im}\boldsymbol A=\dim F^n,

一方面,\operatorname{Im}\boldsymbol A 就是

\{\boldsymbol\alpha_1x_1+\cdots+\boldsymbol\alpha_nx_n\}=\langle\boldsymbol\alpha_1,\boldsymbol\alpha_2,\cdots,\boldsymbol\alpha_n\rangle,

于是 \dim\operatorname{Im}\boldsymbol A=\dim\operatorname{span}\boldsymbol\alpha=\operatorname{rank}\boldsymbol A;另一方面 \dim F^n=n。于是

\dim\ker\boldsymbol A=n-\operatorname{rank}\boldsymbol A.

下面引入线性方程组的解空间。

\bf Definition\;3.3.1\sim3.3.2

注意到所谓线性方程组无非是 F^n 上的方程

\boldsymbol A\boldsymbol x=\boldsymbol y,

而根据定义,所谓解空间 W 就是 \ker\boldsymbol A。由此得到下述定理。

$x_1{\boldsymbol\alpha}_1+x_2{\boldsymbol\alpha}_2+\dots+x_n{\boldsymbol\alpha}_n=0$,设其解空间为 $W$,则有 $$ \dim W=n-\operatorname{rank}{\boldsymbol A}. $$ 进一步,由同态基本定理我们知道 $F^n/W\cong\operatorname{span}\boldsymbol A$。于是就得到关于非齐次线性方程组的如下定理。 $\bf Theorem\;3.3.4\quad$对于域 $F$ 上 $n$ 元非齐次线性方程组 $x_1{\boldsymbol\alpha}_1+x_2{\boldsymbol\alpha}_2+\dots+x_n{\boldsymbol\alpha}_n=\boldsymbol\beta$,我们找到一个特解使得 $\boldsymbol A\boldsymbol\gamma_0=\boldsymbol\beta$,称 $\boldsymbol\gamma_0$ 为它的一个**特解**,那么该非齐次线性方程组的解集 $U$ 是 $$ U=\boldsymbol\gamma_0+W. $$ $Proof.\quad$根据同态基本定理,诱导同态映 $\boldsymbol\gamma_0+W\mapsto\boldsymbol A\boldsymbol\gamma_0=\boldsymbol\beta$。 显然 $U$ 是 $W$ 的一个陪集,我们称它为**线性流形**。 ## 一般线性群 显然 $M_n(F)$ 对矩阵乘法构成幺半群。取其中可逆元素构成的子集 $\operatorname{GL}(n,F):=M_n(F)^{\times}$,则 $\operatorname{GL}(n,F)$ 构成一群,称作域 $F$ 上的**一般线性群**。 对于域 $F$ 上线性空间 $V$ 的所有线性变换,同样可取变换中的可逆者构成一个群,它与上述矩阵的一般线性群在同构意义下无异,故我们将它们统称为一般线性群。 # 矩阵研究的基本方法 ## 秩与行列式 矩阵的秩与乘积有一些最基础的结论,现列举如下。 $\bf Theorem\;4.1.1\sim\;4.1.3 $$ \left|{\boldsymbol A}\right|\left|{\boldsymbol B}\right|=\begin{vmatrix}{\boldsymbol A}&{\bf 0}\\{\bf -I}&{\boldsymbol B}\end{vmatrix} $$ $$ =\begin{vmatrix} a_{11}&a_{12}&\cdots&a_{1n}&0&0&0&0\\ a_{21}&a_{22}&\cdots&a_{2n}&0&0&0&0\\ \vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn}&0&0&0&0\\ -1&0&0&0&b_{11}&b_{12}&\cdots&b_{1n}\\ 0&-1&0&0&b_{21}&b_{22}&\cdots&b_{2n}\\ \vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots\\ 0&0&0&-1&b_{n1}&b_{n2}&\cdots&b_{nn}\\ \end{vmatrix} $$ $$ =\begin{vmatrix} 0&0&0&0&\sum\limits_{k=1}^na_{1k}b_{k1}&\sum\limits_{k=1}^na_{1k}b_{k2}&\cdots&\sum\limits_{k=1}^na_{1k}b_{kn}\\ 0&0&0&0&\sum\limits_{k=1}^na_{2k}b_{k1}&\sum\limits_{k=1}^na_{2k}b_{k2}&\cdots&\sum\limits_{k=1}^na_{2k}b_{kn}\\ \vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots\\ 0&0&0&0&\sum\limits_{k=1}^na_{nk}b_{k1}&\sum\limits_{k=1}^na_{nk}b_{k2}&\cdots&\sum\limits_{k=1}^na_{nk}b_{kn}\\ -1&0&0&0&b_{11}&b_{12}&\cdots&b_{1n}\\ 0&-1&0&0&b_{21}&b_{22}&\cdots&b_{2n}\\ \vdots&\vdots&&\vdots&\vdots&\vdots&&\vdots\\ 0&0&0&-1&b_{n1}&b_{n2}&\cdots&b_{nn}\\ \end{vmatrix} $$ $$ =\begin{vmatrix}{\bf 0}&{\boldsymbol{AB}}\\{\bf -I}&{\boldsymbol B}\end{vmatrix} $$ 使用拉普拉斯定理 ($1.2.4$) 按其前 $n$ 行展开: $$ \begin{vmatrix}{\bf 0}&{\boldsymbol{AB}}\\{\bf -I}&{\boldsymbol B}\end{vmatrix}=\left|{\boldsymbol{AB}}\right|(-1)^{(1+\dots+n)+((n+1)+\dots+(n+n))}\left|{\bf-I}\right|=\left|{\boldsymbol{AB}}\right| $$ 这就证明了定理。$\square

基于第二点,我们可以用行列式来研究矩阵及其运算的秩,这正是 Binet-Cauchy 公式的一个典型应用;对于后者我们不做过多叙述,见 Binet-Cauchy 公式及其应用,这里只给出它的公式表示。

$$ \left|{\boldsymbol{AB}}\right|=\begin{cases}0&s>n\\{\Large\sum\limits_{\footnotesize v_1<\cdots<v_s}}{\boldsymbol A}\begin{pmatrix}1,\;2,\;\cdots,\;s\\v_1,v_2.\cdots,v_s\end{pmatrix}{\boldsymbol B}\begin{pmatrix}v_1,v_2.\cdots,v_s\\1,\;2,\;\cdots,\;s\end{pmatrix}&s\leqslant n\end{cases} $$ 下面是关于矩阵的秩的一些结论,她们的证明是容易的,限于篇幅不再写出。 $\bf Proposition\;4.1.5

矩阵的分块

将矩阵 \boldsymbol{A} 的行和列划分为若干组,从而将 \boldsymbol{A} 划分为若干个子矩阵,称之为对矩阵 \boldsymbol{A} 的分块,\boldsymbol{A} 称为分块矩阵

分块阵的转置是各子矩阵转置阵在分块矩阵上的转置排列,如

\boldsymbol{A}=\begin{pmatrix}\boldsymbol{A}_1&\boldsymbol{A}_2\\\boldsymbol{A}_3&\boldsymbol{A}_4\end{pmatrix}

就是分块矩阵,其转置为

\boldsymbol{A}^T=\begin{pmatrix}\boldsymbol{A}_1^{T}&\boldsymbol{A}_3^{T}\\\boldsymbol{A}_2^{T}&\boldsymbol{A}_4^{T}\end{pmatrix}.

分块矩阵的加乘运算具有与一般矩阵相同的形式。设有分块矩阵

\boldsymbol{A}=\begin{pmatrix} \boldsymbol{A}_{11}&\boldsymbol{A}_{12}&\cdots&\boldsymbol{A}_{1t}\\ \boldsymbol{A}_{21}&\boldsymbol{A}_{22}&\cdots&\boldsymbol{A}_{2t}\\ \vdots&\vdots&\ddots&\vdots\\ \boldsymbol{A}_{u1}&\boldsymbol{A}_{u2}&\cdots&\boldsymbol{A}_{ut} \end{pmatrix} ,\quad\boldsymbol{B}=\begin{pmatrix} \boldsymbol{B}_{11}&\boldsymbol{B}_{12}&\cdots&\boldsymbol{B}_{1v}\\ \boldsymbol{B}_{21}&\boldsymbol{B}_{22}&\cdots&\boldsymbol{B}_{2v}\\ \vdots&\vdots&\ddots&\vdots\\ \boldsymbol{B}_{t1}&\boldsymbol{B}_{t2}&\cdots&\boldsymbol{B}_{tv} \end{pmatrix},

其中二矩阵行划分分别为 s_1\cdots s_u,\,n_1\cdots n_t,列划分分别为 n_\cdots n_t,m_1\cdots m_v,那么其乘积 \bf C=AB 满足

\mathbf{C}=\begin{pmatrix} \sum\limits_{k=1}^t\boldsymbol{A}_{1k}\boldsymbol{B}_{k1}&\sum\limits_{k=1}^t\boldsymbol{A}_{1k}\boldsymbol{B}_{k2}&\cdots&\sum\limits_{k=1}^t\boldsymbol{A}_{1k}\boldsymbol{B}_{kv}\\ \sum\limits_{k=1}^t\boldsymbol{A}_{2k}\boldsymbol{B}_{k1}&\sum\limits_{k=1}^t\boldsymbol{A}_{2k}\boldsymbol{B}_{k2}&\cdots&\sum\limits_{k=1}^t\boldsymbol{A}_{2k}\boldsymbol{B}_{kv}\\ \vdots&\vdots&\ddots&\vdots\\ \sum\limits_{k=1}^t\boldsymbol{A}_{uk}\boldsymbol{B}_{k1}&\sum\limits_{k=1}^t\boldsymbol{A}_{uk}\boldsymbol{B}_{k2}&\cdots&\sum\limits_{k=1}^t\boldsymbol{A}_{uk}\boldsymbol{B}_{kv} \end{pmatrix}

基于这一点,我们有如下推论。

\bf Corollary\;4.2.1\,(1.2.1) \begin{vmatrix} \boldsymbol{A}_{11}&\boldsymbol{A}_{12}&\cdots&\boldsymbol{A}_{1n}\\ \boldsymbol 0&\boldsymbol{A}_{22}&\cdots&\boldsymbol{A}_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ \boldsymbol 0&\boldsymbol 0&\cdots&\boldsymbol{A}_{nn} \end{vmatrix} =\left|\boldsymbol A_{11}\right|\left|\boldsymbol A_{22}\right|\cdots\left|\boldsymbol A_{nn}\right|=\prod_{i=1}^n\left|\boldsymbol A_{ii}\right| 我们亦可以定义分块矩阵的单位阵和初等变换。 $\bf Definition\;4.2.2

我们亦将分块单位矩阵进行一次分块矩阵初等变换所得的矩阵称为分块初等矩阵。

\bf Proposition\;4.2.3 |\boldsymbol I_s-\boldsymbol{AB}|=\begin{vmatrix}\boldsymbol I_n&\boldsymbol B\\\boldsymbol A&\boldsymbol I_s\end{vmatrix}=|\boldsymbol I_n-\boldsymbol{BA}| $\bf Proposition\;4.2.4\quad$设有矩阵 $\bf A,B$,矩阵 $\bf B$ 的列向量组为 $\boldsymbol\beta_1,\cdots,\boldsymbol\beta_m$,则: $$ {\boldsymbol{AB}}={\boldsymbol A}(\boldsymbol\beta_1,\cdots,\boldsymbol\beta_m)=({\boldsymbol A}\boldsymbol\beta _1,\cdots,{\boldsymbol A}\boldsymbol\beta_n) $$ $\bf Corollary\;4.2.5\quad$设有矩阵 $\bf A,B,C$,矩阵 $\bf B,C$ 的列向量组分别为 $\boldsymbol\beta_1,\cdots,\boldsymbol\beta_m,\gamma_1,\cdots,\gamma_m$,则 $\bf AB=C$ 当且仅当 $\boldsymbol\beta_j$ 是线性方程组 ${\bf Ax=\gamma}_j$ 的一个解。 ### 转置、逆和伴随阵的性质 ${\bf Proposition\;4.2.6}\quad (\mathbf{AB})'=\boldsymbol B'\boldsymbol A'. Proof. \begin{aligned}({\boldsymbol{AB}})'(i;j)=&\;({\boldsymbol{AB}})(j;i)=\sum_{k=1}^na_{jk}b_{ki}\\=&\;\sum_{k=1}^nb_{ki}a_{jk}=\sum_{k=1}^n{\boldsymbol B}'(i;k){\boldsymbol A}'(k;j)\\=({\bf B'A'})(i;j).\quad\square\end{aligned} {\bf Proposition\;4.2.7\sim4.2.12}

以上结论的证明都是显然的。

{\bf Corollary\;4.2.13\quad}\left({\boldsymbol A}^{*}\right)^{-1}=\left({\boldsymbol A}^{-1}\right)^*. Proof. \begin{aligned}\frac{1}{|{\boldsymbol A}|}{\boldsymbol A}^*\left({\boldsymbol A}^{-1}\right)^*={\boldsymbol A}^{-1}\left({\boldsymbol A}^{-1}\right)^*=\left|{\boldsymbol A}^{-1}\right|{\boldsymbol I}=\frac{1}{|{\boldsymbol A}|}{\boldsymbol I}\\{\boldsymbol A}^*\left({\boldsymbol A}^{-1}\right)^*={\boldsymbol I},\quad \left({\boldsymbol A}^{*}\right)^{-1}=\left({\boldsymbol A}^{-1}\right)^*\qquad\;\;\end{aligned} {\bf Corollary\;4.2.14\quad}(\boldsymbol A^*)^*=|\boldsymbol A|^{n-2}\boldsymbol A. Proof.\quad\left({\boldsymbol A}^*\right)^*=\left|{\boldsymbol A}^*\right|\left({\boldsymbol A}^*\right)^{-1}=|{\boldsymbol A}|^{n-1}\dfrac{1}{|{\boldsymbol A}|}{\boldsymbol A}=|{\boldsymbol A}|^{n-2}{\boldsymbol A}.\;\;\;\square {\bf Proposition\;4.2.15\quad}(\boldsymbol A\!\boldsymbol B)^*=\boldsymbol B^*\boldsymbol A^*. $$ \begin{aligned} (\boldsymbol{AB})^*(i;j)&=(-1)^{i+j}\boldsymbol{AB}\begin{pmatrix}1,\cdots,j-1,j+1,\cdots,n\\1,\cdots,i-1,i+1,\cdots,n\end{pmatrix}\\ &=(-1)^{i+j}\sum_{1\leqslant v_1<\cdots<v_{n-1}\leqslant n}\boldsymbol A\begin{pmatrix}1,\cdots,j-1,j+1,\cdots,n\\v_1,v_2,\cdots,v_n\end{pmatrix}\boldsymbol B\begin{pmatrix}v_1,v_2,\cdots,v_n\\1,\cdots,i-1,i+1,\cdots,n\end{pmatrix}\\ &=\sum_{k=1}^n(-1)^{j+k}\boldsymbol{A}\begin{pmatrix}1,\cdots,j-1,j+1,\cdots,n\\1,\cdots,k-1,k+1,\cdots,n\end{pmatrix}(-1)^{k+i}\boldsymbol{B}\begin{pmatrix}1,\cdots,k-1,k+1,\cdots,n\\1,\cdots,i-1,i+1,\cdots,n\end{pmatrix}\\ &=\sum_{k=1}^nA_{jk}B_{ki}=\boldsymbol B^*\boldsymbol A^*(i;j).\quad\square \end{aligned} $$ ## 逆矩阵、基变换与矩阵方程 对于矩阵方程 $$ \boldsymbol{AX=B},\qquad (\boldsymbol A\neq\boldsymbol 0), $$ 由分块矩阵的结论我们知道它可分解为一族线性方程组的解。由此我们将矩阵 $\boldsymbol A,\boldsymbol B$ 操作同样的初等行变换,使 $\boldsymbol A\to\boldsymbol G$,$\boldsymbol G$ 是 $\boldsymbol A$ 的简化行阶梯矩阵。也即 $$ (\boldsymbol A,\boldsymbol B)\;\longrightarrow\;(\boldsymbol G,\boldsymbol D), $$ 从 $(\boldsymbol G,\boldsymbol D)$ 可写出每个线性方程组 $\boldsymbol {Ax=\boldsymbol\beta}_j$ 的解,从而得出 $\boldsymbol X$。 ${\bf Theorem\;4.3.1\quad}n$ 级矩阵 $\boldsymbol A$ 可逆当且仅当 $\operatorname{rank}\boldsymbol A=n$。 $Proof.\quad$方程 $\boldsymbol A\boldsymbol X=\boldsymbol I$ 有解说明 $\boldsymbol I$ 的每一个列向量都属于 $\operatorname{Im}\boldsymbol A$,因此 $\operatorname{rank}\boldsymbol A=\dim\operatorname{Im}\boldsymbol A\geqslant n$。 现在我们来看一个对于 $n$ 级矩阵 $\boldsymbol A$,将它乘上 $\boldsymbol B$ 实际上是在干什么。记 $\boldsymbol C=\boldsymbol{AB}$,首先有 $$ \operatorname{rank}\boldsymbol C\leqslant\operatorname{rank}\boldsymbol B, $$ 而当 $\operatorname{rank}\boldsymbol B=n$ 时 $|\boldsymbol C|\neq 0$,因此 $\operatorname{rank}\boldsymbol C=n$。另一方面,这表明 $\boldsymbol B$ 与 $\boldsymbol C$ 的行向量和列向量都能分别组成 $F^n$ 中的一组基。另一方面,由秩的关系,矩阵方程 $\boldsymbol B\boldsymbol X=\boldsymbol C$ 一定有解。由此我们抽离出基变换的概念。 $\bf Definition\;4.3.2\quad$给定 $F^n$ 上的两组基 $\boldsymbol\alpha,\cdots,\boldsymbol\alpha_n,\,\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n$,则有 $$ \begin{cases} \boldsymbol\beta_1=a_{11}\boldsymbol\alpha_1+a_{12}\boldsymbol\alpha_2+\dots+a_{1n}\boldsymbol\alpha_{n}\\ \boldsymbol\beta_2=a_{21}\boldsymbol\alpha_1+a_{22}\boldsymbol\alpha_2+\dots+a_{2n}\boldsymbol\alpha_n\\ \vdots\qquad\qquad\vdots\qquad\qquad\qquad\vdots\qquad\;\vdots\\ \boldsymbol\beta_n=a_{n1}\boldsymbol\alpha_1+a_{n2}\boldsymbol\alpha_2+\dots+a_{nn}\boldsymbol\alpha_n \end{cases} $$ $$ \begin{pmatrix} \boldsymbol\beta_1\\ \boldsymbol\beta_2\\ \vdots\\ \boldsymbol\beta_n \end{pmatrix} = \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{pmatrix} \begin{pmatrix} \boldsymbol\alpha_1\\ \boldsymbol\alpha_2\\ \vdots\\ \boldsymbol\alpha_n \end{pmatrix}, $$ 则右端 $n$ 阶矩阵 ${\boldsymbol A}$ 称为从基 $\boldsymbol\alpha$ 到基 $\boldsymbol\beta$ 的**过渡矩阵**,该式称为**基变换**。 显然基变换是 $F^n\to F^n$ 的线性变换。事实上上述讨论中矩阵 $\boldsymbol A,\boldsymbol B$ 的地位是完全等同的,即 $\boldsymbol{AB}=\boldsymbol C$ 同时给出了以 $\boldsymbol A$ 和 $\boldsymbol B$ 为过渡矩阵的两个基变换。由此不难得到以下结论。 $\bf Theorem\;4.3.3\quad$若对于基 $\boldsymbol\alpha_1,\cdots,\boldsymbol\alpha_n$ 及向量 $\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n$ 满足 $(\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n)=(\boldsymbol\alpha_1,\cdots,\boldsymbol\alpha_n){\boldsymbol A}$,则 $\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n$ 是一个基当且仅当 ${\boldsymbol A}$ 是可逆矩阵。 $\bf Definition\;4.3.4\quad$对于 $\boldsymbol\alpha\in F^n$ 和基 $\boldsymbol\alpha_1,\cdots,\boldsymbol\alpha_n$ 以及 $\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n$,$\boldsymbol\alpha$ 在这两个基下坐标为 $\boldsymbol x,\boldsymbol y$,则其在基变换 $(\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n)=(\boldsymbol\alpha_1,\cdots,\boldsymbol\alpha_n){\boldsymbol A}$ 下的坐标满足 $\boldsymbol{xA}=\boldsymbol y$,其称为**坐标变换**。 $\bf Proposition\;4.3.5\quad$若有基变换 $(\boldsymbol\beta_1,\cdots,\boldsymbol\beta_n)=(\boldsymbol\alpha_1,\cdots,\boldsymbol\alpha_n){\boldsymbol A}$ 及坐标变换 $\boldsymbol{xA}=\boldsymbol y$,则有逆变换 $\boldsymbol{x}=\boldsymbol y\boldsymbol A^{-1}$。 ### 再谈 Cramer 法则 若线性方程组 $$ \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{pmatrix} \begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix} =\begin{pmatrix}b_1\\b_2\\\vdots\\b_n\end{pmatrix} $$ 有唯一解,则相当于给出 $F^n$ 中基 $b_1,\cdots,b_n$ 及过渡矩阵 ${\boldsymbol A}$,依此解出基 $x_1,\cdots,x_n$。 反过来,假设我们得到了以下方程组 $$ \begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{pmatrix} \begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix} =\begin{pmatrix}b_1\\b_2\\\vdots\\b_n\end{pmatrix} $$ 并设 $\det{\boldsymbol A}\neq 0$,那么该方程有唯一解。循以上思路,我们有 $$ \begin{aligned} \begin{pmatrix}x_1\\x_2\\\vdots\\x_n\end{pmatrix} &=\begin{pmatrix} a_{11}&a_{12}&\cdots&a_{1n}\\ a_{21}&a_{22}&\cdots&a_{2n}\\ \vdots&\vdots&\ddots&\vdots\\ a_{n1}&a_{n2}&\cdots&a_{nn} \end{pmatrix}^{-1}\begin{pmatrix}b_1\\b_2\\\vdots\\b_n\end{pmatrix}\\ &=\frac{1}{\left|{\boldsymbol A}\right|}\begin{pmatrix} A_{11}&A_{21}&\cdots&A_{n1}\\ A_{12}&A_{22}&\cdots&A_{n2}\\ \cdots&\vdots&\ddots&\vdots\\ A_{1n}&A_{2n}&\cdots&A_{nn} \end{pmatrix}\begin{pmatrix}b_1\\b_2\\\vdots\\b_n\end{pmatrix}\\ &=\left(\frac{|\boldsymbol B_1|}{|\boldsymbol A|},\frac{|\boldsymbol B_2|}{|\boldsymbol A|},\cdots,\frac{|\boldsymbol B_n|}{|\boldsymbol A|}\right)', \end{aligned} $$ 我们就得到了 Cramer 法则。