多元拉反的推广:Abhyankar-Gurjar 反演公式的证明及应用

· · 算法·理论

鸽了快两个月的证明终于来了!以下证明均来自论文 NEW PROOFS FOR THE ABHYANKAR-GURJAR INVERSION FORMULA AND THE EQUIVALENCE OF THE JACOBIAN CONJECTURE AND THE VANISHING CONJECTURE 以及 EXPONENTIAL FORMULAS FOR THE JACOBIANS AND JACOBIAN MATRICES OF ANALYTIC MAPS,我们只取其中相关的部分,别的就不管了。

基础定义

我们总假定在特征为 0 的域 k 上讨论。

考虑形式幂级数环 k[[\mathbf{x}]],其中 \mathbf{x} = (x_1, \dots, x_n)。对于任意 f \in k[[\mathbf{x}]],定义其最低阶 o(f)f 中非零项的最小幂次(定义 o(0)=\infty),最高阶 O(f) 为最大幂次。对于向量 \mathbf{f} = (f_1, \dots, f_n) \in k[[\mathbf{x}]]^n,定义 o(\mathbf{f}) = \min_i o(f_i)O(\mathbf{f}) = \max_i O(f_i)

定义集合 \mathcal{F}_ 0 为所有满足 x_i\mid f_i,(f_i/x_i)(\mathbf 0)\neq 0\mathbf{f} 构成的集合,则多元 Lagrange 反演的适用范围就是 \mathcal F_0

定义集合 \mathcal{F}_ 1 为所有满足 o(f_i - x_i) \geq 2\mathbf{f} 构成的集合,这是 A-G 反演公式的适用范围。可以发现 \mathcal F_0\subsetneq\mathcal F_1,因此我们下面要讲的 A-G 反演公式推广了多元 Lagrange 反演。

下面是多重指标的一些基本定义。

我们再简要介绍一下微分算子,定义 \partial_i = \frac{\partial}{\partial x_i},例如 \partial_i (x_j) = [i=j]。微分算子是形如

\sum_{\alpha\in\mathbb N^n}A_\alpha\partial^{\alpha}

的算子。为了保证这个无穷求和会收敛,其实我们应该加上一个条件:\lim_{|\alpha|\rightarrow\infty}[o(A_\alpha)-|\alpha|]=\infty,不过这不在我们的讨论范围内,因为后面用到的微分算子都是收敛的。

根据 Leibniz 公式可知,形如 \sum_{\alpha\in\mathbb N^n}\partial^{\alpha}B_\alpha 的算子也是微分算子。并且微分算子之和、之积(即复合)也是微分算子。但需要注意,微分算子的乘法不一定满足交换律,例如 \phi = x \partial_y,\psi= y \partial_x,作用在 u = x^2 y 上有 \phi\psi u=\phi(2xy^2)=4x^2y,\psi\phi u=\psi(x^3)=3x^2y,是不一样的。

定理证明

性质 1. 对于任意 \mathbf{f} \in \mathcal{F}_ 1,存在唯一的向量 \mathbf{a} = (a_1, \dots, a_n) \in k[[\mathbf{x}]]^n,满足 o(\mathbf{a}) \geq 2,且使得

\mathbf{f} = \exp(\mathbf{a} \partial) \mathbf{x},

其中 \mathbf{a} \partial = \sum_{i=1}^n a_i \partial_i 是微分算子,其在向量值函数上的作用定义为分别作用于每个分量,且 \exp(\mathbf{a} \partial) 是指数映射(由 Taylor 级数定义)。等价地,对每个 i,有 f_i = \exp(\mathbf{a} \partial) x_i

证明. 我们通过构造法证明 \mathbf{a} 的存在唯一性。核心思想是将 \mathbf{f}\mathbf{a} 分解为齐次分量,并从低次到高次逐次确定 \mathbf{a} 的分量。具体如下。

第一步,我们做齐次分解,设 \mathbf{f} = \sum_{i=1}^{\infty} \mathbf{g}_ i,其中每个 \mathbf{g}_ i 是齐 i 次的向量(即 o(\mathbf{g}_ i) = O(\mathbf{g}_ i) = i),且由 \mathcal{F}_ 1 的定义知 \mathbf{g}_ 1 = \mathbf{x}。类似地,设 \mathbf{a} = \sum_{i=2}^{\infty} \mathbf{b}_ i,其中每个 \mathbf{b}_ i 是齐 i 次的向量。我们的目标是归纳地找出每个 \mathbf{b}_ i

第二步,我们考虑指数映射的展开。回顾 \exp(\mathbf{a} \partial) \mathbf{x} = \sum_{j=0}^{\infty} \frac{(\mathbf{a} \partial)^j}{j!} \mathbf{x},一个关键观察是,当 j \geq 1 时,算子 \frac{(\mathbf{a} \partial)^j}{j!} 作用在 \mathbf{x} 上会提升阶数。具体地,因为 \mathbf{x} 的阶数为 1,且每次应用微分算子 \mathbf{a} \partial 至少增加阶数 1(因 o(\mathbf{a}) \geq 2,且微分降低阶数 1),所以 o( \frac 1{j!}{(\mathbf{a} \partial)^j} \mathbf{x} ) \geq j + 1。这意味着在计算 \mathbf b_i 时,只需考虑展开式中 j \leq i-1 的部分。

第三步,我们开始归纳构造。当 i=2 时,比较 \mathbf{f} = \exp(\mathbf{a} \partial) \mathbf{x} 两边阶数为 2 的项,可得 \mathbf b_2=\mathbf g_2。而当 i\ge 3 时,假设 \mathbf{b}_ 2, \dots, \mathbf{b}_ {i-1} 已被唯一确定,记 \mathbf b' = \sum_{j=2}^{i-1} \mathbf{b}_ j。要得到 \mathbf b_i,我们完全可以忽略次数高于 i 的项,即 (\mathbf a\partial)^j\mathbf x=(\mathbf b'\partial+\mathbf b_i\partial)^j\mathbf x+\cdots。而对于 j\ge 2,l\ge 1,我们有 o((\mathbf b'\partial)^{j-l}(\mathbf b_i\partial)^l\mathbf x)\ge (j-l)+l(i-1)+1\ge i+1,也是可以忽略掉的。所以就有

\sum_{j=1}^{i}\mathbf g_j+\cdots=\mathbf x+\mathbf b'+\mathbf b_i+\sum_{j=2}^{i-1}\frac{1}{j!}(\mathbf b'\partial)^j\mathbf x+\cdots.

那么 \mathbf b_i 的存在唯一性也就显然了。

综上,\mathbf{a} = \sum_{i=2}^{\infty} \mathbf{b}_ i 存在且唯一。\Box

性质 1 允许我们将向量值幂级数写为微分算子的指数映射的形式,下面这个性质则会告诉我们这样改写的优势所在。

性质 2. 对于 \mathbf f\in\mathcal F_1,设 \mathbf f=\exp(\mathbf a\partial)\mathbf x,则任给 u\in k[[\mathbf x]],我们总有

u(\mathbf f)=\exp(\mathbf a\partial)u(\mathbf x).

特别地,任给 k\in\mathbb Z,定义 \mathbf f^{[k]}(\mathbf x)\mathbf fk 次复合,若 k<0 则定义为其反函数的 -k 次复合,那么有

\mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x.

证明. 要证明 u(\mathbf f)=\exp(\mathbf a\partial)u(\mathbf x),只需证明 \exp(\mathbf a\partial)k[[\mathbf x]] 上的同态。记 A=\mathbf a\partial,显然 e^A(g+h)=e^Ag+e^Ah,以下证明 e^A(gh)=(e^Ag)(e^Ah)

因为 \mathbf a\partial 满足 Leibniz 律,所以有 Leibniz 公式 (\mathbf a\partial)^k(gh)=\sum_i\binom ki[(\mathbf a\partial)^ig][(\mathbf a\partial)^{k-i}h],于是

\begin{aligned}\exp(\mathbf a\partial)(gh)&=\sum_{k\ge 0}\frac 1{k!}(\mathbf a\partial)^k(gh)\\&=\sum_{k\ge 0}\frac 1{k!}\sum_{i\ge 0}\binom ki[(\mathbf a\partial)^ig][(\mathbf a\partial)^{k-i}h]\\&=\sum_{k,i\ge 0}\frac {[(\mathbf a\partial)^ig]}{i!}\frac{[(\mathbf a\partial)^{k-i}h]}{(k-i)!}\\&=[\exp(\mathbf a\partial)g][\exp(\mathbf a\partial)h],\end{aligned}

g\mapsto e^Ag 是同态,故有 u(\mathbf f)=e^Au

由此可以归纳得到,如果 k\ge 0\mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x,则

\mathbf f^{[k+1]}=\mathbf f(\mathbf f^{[k]})=\exp(k\mathbf a\partial)\mathbf f=\exp(k\mathbf a\partial)\exp(\mathbf a\partial)\mathbf x=\exp((k+1)\mathbf a\partial)\mathbf x.

k<0,记 \mathbf g=\exp(-\mathbf a\partial)\mathbf x,显然 \mathbf g\circ \mathbf f=\mathbf f\circ\mathbf g=\mathbf {id},且

\mathbf f^{[k]}=\mathbf g^{[-k]}=\exp((-k)(-\mathbf a\partial ))\mathbf x=\exp(k\mathbf a\partial )\mathbf x.

这表明 \mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x 对任意的整数 k 总是成立的。\Box

性质 2 的结论启发我们延拓复合幂的定义,以下令 \mathbf f^{[t]}=\exp(t\mathbf a\partial)\mathbf x\in k[[t,\mathbf x]]^n

性质 3. 对于 \mathbf f\in\mathcal F_1,设 \mathbf f=\exp(\mathbf a\partial)\mathbf x,则 \mathbf f^{[t]} 的 Jacobi 行列式

\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)1.

其中 \nabla\mathbf a=\sum_i (\partial _ ia_i)。且任给 u\in k[[\mathbf x]],总有

u(\mathbf f^{[t]})\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)u.

证明. 记 K(t)=\det J(\mathbf f^{[t]}),H(t)=\exp(t\mathbf a\partial+t\nabla\mathbf a)1,则 H(t) 为以下微分方程的唯一解:

\begin{cases}H(0)=1,\\ H'(t)=(\mathbf a\partial+\nabla \mathbf a)H(t).\end{cases}

因此,要证明 K=H,只需证明 K 也满足以上两式。K(0)=\det J(\mathbf f^{[0]})=\det J(\mathbf{id})=1,以下求 K'(t)

\mathbf f^{[t]}=(f_1^{[t]},f_2^{[t]},\cdots,f_n^{[t]}),则 f_i^{[t]}=\exp(t\mathbf a\partial)x_i。因为行列式求导等于逐列求导并相加,所以

\vdots &\ddots&\vdots\\ \partial_1f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}=\sum_{i=1}^n\begin{vmatrix}\partial_1f_1^{[t]}&...&\partial_t\partial_if_1^{[t]}&...&\partial_nf_1^{[t]}\\ \partial_1f_2^{[t]}&...&\partial_t\partial_if_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &&\vdots&&\vdots\\ \partial_1f_n^{[t]}&...&\partial_t\partial_if_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}.

A=\mathbf a\partial,我们以 i=1 为例,演示如何计算后面这些行列式。注意区分 A,\nabla \mathbf a,前者是导子,后者只是一个幂级数。

\partial_t\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ \partial_t\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}&=\begin{vmatrix}\partial_1(A f_1^{[t]})&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\ \partial_1(A f_2^{[t]})&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ \partial_1(A f_n^{[t]})&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}\\&=\begin{vmatrix} \sum _ i(\partial_1 a_i) (\partial_if_1^{[t]})&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\ \sum _ i(\partial_1 a_i) (\partial_if_2^{[t]})&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ \sum _ i(\partial_1 a_i) (\partial_if_n^{[t]})&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}+\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\ A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}\\&=\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\ A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}+\sum _ i(\partial_1 a_i) \begin{vmatrix} \partial_if_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\\partial_if_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ \partial_if_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}\\&=\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\ A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\ \vdots &\vdots&\ddots&\vdots\\ A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]} \end{vmatrix}+(\partial_1a_1)\det J(\mathbf f^{[t]}).\end{aligned}

故有 K'(t)=A\det J(\mathbf f^{[t]})+\nabla\mathbf a\det J(\mathbf f^{[t]})=(\mathbf a\partial+\nabla \mathbf a)K(t),即 K=H

至于 u(\mathbf f^{[t]})\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)u,也可以通过证明两端满足同个微分方程来得到,留给读者完成。提示:\partial _ t u(\mathbf f^{[t]})=(\mathbf a\partial )u(\mathbf f^{[t]})\Box

下面我们引入一个重要的线性映射 \tau,它将微分算子映射为微分算子。定义为

\tau(h(\mathbf x)\partial^\alpha)=(-1)^{|\alpha|}\partial^\alpha h(\mathbf x).

我们可以这样理解,它交换了乘法和求导的先后顺序,并改变了符号。它有如下类似于矩阵转置的性质。

性质 4. \tau 是反对合映射,也就是说,\tau^2=id,且任给微分算子 \phi,\psi,有 \tau(\phi\psi)=\tau(\psi)\tau(\phi)(注意 \psi,\phi 的顺序)。

证明.

\begin{aligned}\tau^2(h\partial^\alpha)&=\tau((-1)^{|\alpha|}\partial^\alpha h)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|}\tau((\partial^{\alpha-\beta}h)\partial^\beta)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|-|\beta|}\partial^\beta(\partial^{\alpha-\beta}h)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|-|\beta|}\sum_{\gamma\le \beta}\binom{\beta}{\gamma}(\partial^{\alpha-\gamma}h)\partial^\gamma\\&=\sum_{\gamma\le \alpha}\binom{\alpha}{\gamma}(\partial^{\alpha-\gamma}h)\partial^\gamma\sum_{\beta}\binom{\alpha-\gamma}{\alpha-\beta}(-1)^{|\alpha|-|\beta|}\\&=h\partial^\alpha.\end{aligned}

第二条只需设 \phi=h\partial^\alpha,\psi=g\partial^\beta 去验证就好了,留给读者。验证时注意等式两边可以消掉的要及时消掉,不然计算量很大。\Box

到这里我们所有准备工作都完成了,下面开始证明 A-G 反演公式。

定理 5. 设 \mathbf f,\mathbf g\in\mathcal F_1,记 \mathbf h=\mathbf x-\mathbf g,若 \mathbf f\circ\mathbf g=\mathbf {id},则任给 u\in k[[\mathbf x]],有

u(\mathbf f)=\sum_{ \alpha}\frac 1{\alpha!}\partial ^\alpha ( u\, \mathbf h^\alpha \det J(\mathbf g)).

证明. 根据性质 1 和性质 2,设

\mathbf f=\exp(\mathbf a\partial)\mathbf x,\quad \mathbf g=\exp(-\mathbf a\partial)\mathbf x.

A=\mathbf a\partial,则 u(\mathbf g)=e^{-A}u

另一方面,根据 \mathbf h=\mathbf x-\mathbf g,我们在 \mathbf x 处对 u 作 Taylor 展开:

u(\mathbf g)=\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha u.

相减可得 (e^{-A}-\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha)u=0

又因为这个式子对于任意的 u 都成立,所以微分算子必为 0,即

e^{-A}=\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha.

\tau 作用在此式两端可得:

\tau(e^{-A})=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha.

因为 \tau 是反对合的,所以 \tau(\phi^k)=\tau(\phi)^k,故有 \tau(e^{-A})=e^{-\tau(A)}。回忆 A=\sum_i a_i\partial_i,我们有

e^{-\tau(A)}=\exp\left({\sum_i\partial_ia_i}\right)=\exp(A+\nabla\mathbf a).

由此可得 \exp(A+\nabla\mathbf a)=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha

根据性质 3,令 t=1v(\mathbf f)\det J(\mathbf f)=\exp(\mathbf a\partial+\nabla\mathbf a)v。再令 v=u\det J(\mathbf g) 可得

u(\mathbf f)=u(\mathbf f)(\det J(\mathbf g)|_{\mathbf x=\mathbf f})\det J(\mathbf f)=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha u\det J(\mathbf g).

最后一个等号是因为 (\det J(\mathbf g)|_{\mathbf x=\mathbf f}) \det J(\mathbf f) = \det J(\mathbf g \circ \mathbf f) = \det J(\mathbf{id}) = 1\Box

简单应用

我们之前提过,若只考虑形式幂级数,则 A-G 反演公式严格强于多元 Lagrange 反演,这里我们试着用 A-G 反演推 Lagrange 反演。

推论 6. 对于 \mathbf f,\mathbf g\in \mathcal F_0,以及 u\in k[[\mathbf x]],若 \mathbf f\circ\mathbf g=\mathbf{id},则任给 \alpha\in\mathbb N^n,有

[\mathbf x^\alpha] u(\mathbf f)=[\mathbf x^{-\mathbf 1}]\frac{u}{\mathbf g^{\alpha+\mathbf 1}}\det J(\mathbf g).

证明. 根据定理 5,设 \mathbf h=\mathbf x-\mathbf g,则

\begin{aligned}[\mathbf x^\alpha]u(\mathbf f)&=\sum_{ \beta}\frac 1{\beta!}[\mathbf x^\alpha]\partial ^\beta ( u\, \mathbf h^\beta \det J(\mathbf g))\\&=\sum_{ \beta}\binom {\alpha+\beta}{\alpha}[\mathbf x^{\alpha+\beta}] u\, \mathbf (\mathbf x-\mathbf g)^\beta \det J(\mathbf g)\\&=[\mathbf x^{\alpha}]\sum_{ \beta}\binom {\alpha+\beta}{\alpha} (\mathbf 1-\mathbf g/\mathbf x)^\beta u\det J(\mathbf g)\\&=[\mathbf x^{\alpha}] \frac 1{(\mathbf g/\mathbf x)^{\alpha+\mathbf 1}}u\det J(\mathbf g)\\&=[\mathbf x^{-\mathbf 1}]\frac{u}{\mathbf g^{\alpha+\mathbf 1}}\det J(\mathbf g).\ \Box\end{aligned}

最后,作为结尾,我们以之前给的一道思考题来举例说明 A-G 反演公式的应用。

推论 7. 若 f\in k[[x,y]] 满足 f(0,0)=0,f(x,y)-[f(y,x)]^2=x,则

f(x,y)=\sum_{a,b\ge 0}\binom{2a}{b}\binom{2b+1}{a}x^{2b-a+1}y^{2a-b}-4\sum_{a,b\ge 0}\binom{2a+1}{b}\binom{2b+2}{a}x^{2b-a+2}y^{2a-b+1}.

证明. 容易证明若设 \mathbf f=(f(x,y),f(y,x)),则 \mathbf f\in\mathcal F_1,且令 \mathbf g=(x-y^2,y-x^2),有 \mathbf g\circ\mathbf f=\mathbf {id},\mathbf h=(x,y)-\mathbf g=(y^2,x^2)。取 u(x,y)=x,根据定理 5 可得

f(x,y)=\sum_{a,b\ge 0}\frac 1{a!b!}\partial_x^a\partial_y^b ( x\, y^{2a}x^{2b}(1-4xy)).

稍微整理一下即得答案。\Box

当然,这道题也有别的做法,就是硬套四次求根公式。但很显然,既不优雅,也不好算,更难扩展。

对了,有没有人给这个公式来个组合证明(