题解:P10775 BZOJ4162 shlw loves matrix II

· · 题解

本文不铺陈线性代数基础以及后续做法,只讨论作为本题的最重要一步——Cayley-Hamilton 定理的证明。所有证明都并非我的原创。

定理 (Cayley-Hamilton).R 是交换环,\varphi 是有限生成自由 R-模上的自同态,其特征多项式为 p(\lambda) = \det(\lambda \mathrm{id} - \varphi) \in R[X],则 p(\varphi) = 0(由于 \mathrm{End}(M)R-代数)。

不少证明并不能涵摄 R 是全部交换环的情形。

(0) 错误的证明

p(\lambda) = \det(\lambda \mathrm{id} - \varphi) \implies p(\varphi) = \det(\varphi \mathrm{id} - \varphi) = \det(0) = 0.

这个证明的错误在于:p(\varphi) 本应属于 \mathrm{End}(M),但在这个证明中最后一项是行列式的结果,属于 R

(1) 直接、简洁的证明

考虑 \varphi_\lambda\lambda \mathrm{id} - \varphi,它是 M[\lambda] = R[\lambda] \underset{R}\otimes M 的自同态。这样,根据初等线性代数,

\varphi_\lambda^{\rm adj} \varphi_\lambda = p \mathrm{id}.

这样,

\begin{aligned} p(\varphi) v &= \left.p(x)v\right\rvert_{x = \varphi} \\ &= \left.\varphi_\lambda^{\rm adj} (xv - \varphi v)\right\rvert_{x = \varphi} \\ &= 0. \end{aligned}

这个证明曾风靡一时,但实际上观看它的实质就会发现我们只是变了个戏法然后把 \varphi 带了进去。这是如何成立的?解释它可能要花一些时间。我们做的事实质上是把 p 在环 \mathrm{End}(M)[\lambda] 上进行了一个因式分解:分解为 \varphi_\lambda^{\rm adj} \varphi_\lambda。这里它在 \mathrm{End}(M[\lambda]) 上是复合的关系,而到了 \mathrm{End}(M)[\lambda] 就成了乘积。

然后我们实际上在非交换环 \mathrm{End}(M) 上操作要格外小心,因为实际上 f_L(x)g_L(x) = (fg)_L(x) 并不成立,其中 L 代表带入多项式时每一项形如 a_kx^k,而 R 代表带入多项式时每一项形如 x^ka_k。但是,我们还是有单侧因式定理:

f_L(x) = 0 \implies (fg)_L(x) = 0, g_R(x) = 0 \implies (fg)_R(x) = 0.

我们用到的就是后一条。\varphi_\lambda 从右面带入 \varphi0,因此 \varphi_\lambda^{\rm adj} \varphi_\lambda 从右面带入 \varphi 也是 0

我们还要说明它和前面的伪证到底有什么区别。区别在于:

\mathrm{ev}_\varphi \circ \det(\varphi_\lambda)

是复合的关系。第一个证明将它与

\det \circ\ \mathrm{ev}_\varphi(\varphi_\lambda)

混淆。而第二个证明通过将 \mathrm{ev}_\varphi \circ \det 整体转化得到了乘积的形式,才完成了证明。

现在的线性代数课本很少涉及这个证明,就是因为它带来的此种误会。

(2) 大力出奇迹

通过计算矩阵元直接证明结果。证明在这个论文集的 32-36 页。

(3) 对维度归纳

M \simeq R^nR 是域。注意到,当 \operatorname{span}\{\varphi^k v : 0 \le k < n\} = M 时,v, \varphi v, \dots, \varphi^n v 线性相关,导出存在 n 次多项式 f 使得 f(\varphi) = 0。在 \varphi^k v 这组基下,\varphi 的表示矩阵是 f 的友阵。也就是说,p = fp(\varphi) = 0

现在对 n 归纳。设任取 v \in M \setminus \{0\},并定义 m = \dim W, W = \{\varphi^k v : 0 \le k < n\}。如果 m = n,则归结到上一段的内容,否则将 \varphi^k v~(0 \le k < m) 扩充为一组基 \mathfrak B。在这组基下,\varphi 是分块上三角的

M = \begin{pmatrix} A & B \\ 0 & C \end{pmatrix},

(这是因为 \varphi(\varphi^k v) \in W。)根据归纳假设,p_A(A) = 0, p_C(C) = 0。这样我们有

p_{M}(M) = p_A(M) p_C(M) = \begin{pmatrix} 0 & * \\ 0 & * \end{pmatrix} \begin{pmatrix} 0 & 0 \\ * & * \end{pmatrix} = 0.

利用不变子空间可以将其进行改写。并无本质不同,略去。

(4) 扩充到多项式环去

R 是域,R' = \mathrm{Sym}(\mathrm{End}(M)^*),其中 V^*V 的对偶空间,\mathbb F = \mathrm{Frac}(R'), \mathbb K = \overline {\mathbb F}M' = M \underset R \otimes R'。这样,我们有自然的 M' 的自同态:\varphi(v \otimes f) = f(v)。具体而言,若 n = \dim MR'R 上有 n^2 个变元 X_{ij} 的多项式环,而 \varphi 是在说 \varphi_{ij} = X_{ij},作为 R' 上的 n \times n 矩阵。直觉上,\varphi 给出了“一般”的算子,安插 X_{ij} 的值可以得到特殊的算子。

现在我们证明,\varphi\mathbb K 上有 n 个不同的特征值:否则,考虑 \varphi 的特征多项式 p,我们有判别式 \Delta(p) = 0。这样,设 \psi \in \mathrm{End}(M),其特征多项式为 q,定义代数同态 c : R' \to RF \mapsto F(\psi),它满足 c(\varphi) = \psi。那么 \Delta(q) = \Delta\circ\mathrm{charpoly}\circ c(\varphi) = c \circ \Delta(p) = 0,于是所有的算子都不可能有 n 个不同的特征值,这是显然不对的。所以断言成立,于是 \varphi 的 Cayley-Hamilton 定理成立。

仍然取 \psi \in \mathrm{End}(M),其特征多项式为 q,以及上述构造的映射 c,则

q(\psi) = c(p(\varphi)) = 0.

这是我最喜欢的证明。

(5) 一个常见的《高等代数》书的证明

假设 R 是域,把 M 当成 M \underset R \otimes \overline R(例如,R = \mathbb C,这是《高等代数》书中常考虑的)。通过归纳法可以证明 \varphi 在适当的基下是一个上三角阵 A。我们曾经计算过

p_{M}(M) = p_A(M) p_C(M) = \begin{pmatrix} 0 & * \\ 0 & * \end{pmatrix} \begin{pmatrix} 0 & 0 \\ * & * \end{pmatrix} = 0, M = \begin{pmatrix} A & * \\ O & C \end{pmatrix}.

所以 Cayley-Hamilton 定理对所有的上三角阵成立,进而对所有复矩阵成立。

(6) 拓扑学证明

假设 R 是整环,\mathbb F = \mathrm{Frac}(R), \mathbb K = \overline {\mathbb F}, R' = \mathbb K[X_{ij} : 0 \le i, j < n],在 \mathbb K^{n^2} 作为环上装配 Zariski 拓扑,则任意的 \mathbb K^{n^2} \to \mathbb K 的多项式函数 f \in R' 是连续的。考虑特征多项式,作为矩阵元的多项式,有 \mathrm{charpoly} \in R'[X],这样考虑 P = \Delta(\mathrm{charpoly}) \in R'\Delta 表示判别式)。考虑 U = P^{-1}(0)^\complement,它是稠密的开集。

好,我们考虑一下 P(X_{ij}) = 0 的意义:它表示矩阵 X 的特征多项式有重根,因此 P(X_{ij}) \ne 0 代表 X 的特征多项式无重根,因此可以推出 X 是可对角化的,符合 Cayley-Hamilton 定理。这样,根据稠密性,所有的矩阵符合 Cayley-Hamilton 定理。

(7) 复分析证明

自然要假设 R = \mathbb C。设 C 是包含 0 的简单闭曲线,则

\begin{aligned} p &= \sum_{k=0}^n \dfrac{x^k}{\tau \mathrm i} \oint_C \dfrac{p(\zeta)}{\zeta^{k+1}} \mathrm d\zeta \\ p(\varphi) &= \sum_{k=0}^n \dfrac{\varphi^k}{\tau \mathrm i} \oint_C \dfrac{p(\zeta)}{\zeta^{k+1}} \mathrm d\zeta \\ &= \dfrac 1{\tau \mathrm i} \oint_C \dfrac{p(\zeta)}{\zeta} \sum_{k=0}^{n} (\zeta^{-1} \varphi)^k \mathrm d\zeta \\ &= \dfrac 1{\tau \mathrm i} \oint_C p(\zeta) (\zeta \mathrm{id} - \varphi)^{-1} (\mathrm {id} - \zeta^{-n-1} \varphi^{n+1}) \mathrm d\zeta \\ &= \dfrac 1{\tau \mathrm i} \oint_C (\zeta \mathrm{id} - \varphi)^{\rm adj} (\mathrm {id} - \zeta^{-n-1} \varphi^{n+1}) \mathrm d\zeta \\ &= \dfrac 1{\tau \mathrm i} \oint_C (\zeta \mathrm{id} - \varphi)^{\rm adj} \mathrm d\zeta + \dfrac 1{\tau \mathrm i} \oint_C (\zeta \mathrm{id} - \varphi)^{\rm adj} \zeta^{-n-1} \varphi^{n+1} \mathrm d\zeta. \end{aligned}

第一项的每个矩阵元为 \le n-1 次多项式,根据 Cauchy 积分公式为 0 矩阵,第二项的每个矩阵元均为 \le -2 次分式,积分为 0 矩阵。

复分析还有其它的证明。不再赘述。