多元拉反的推广:Abhyankar-Gurjar 反演公式的证明及应用
飞雨烟雁
·
2025-06-25 23:45:25
·
算法·理论
鸽了快两个月的证明终于来了!以下证明均来自论文 NEW PROOFS FOR THE ABHYANKAR-GURJAR INVERSION FORMULA AND THE EQUIVALENCE OF THE JACOBIAN CONJECTURE AND THE VANISHING CONJECTURE 以及 EXPONENTIAL FORMULAS FOR THE JACOBIANS AND JACOBIAN MATRICES OF ANALYTIC MAPS,我们只取其中相关的部分,别的就不管了。
基础定义
我们总假定在特征为 0 的域 k 上讨论。
考虑形式幂级数环 k[[\mathbf{x}]] ,其中 \mathbf{x} = (x_1, \dots, x_n) 。对于任意 f \in k[[\mathbf{x}]] ,定义其最低阶 o(f) 为 f 中非零项的最小幂次(定义 o(0)=\infty ),最高阶 O(f) 为最大幂次。对于向量 \mathbf{f} = (f_1, \dots, f_n) \in k[[\mathbf{x}]]^n ,定义 o(\mathbf{f}) = \min_i o(f_i) 和 O(\mathbf{f}) = \max_i O(f_i) 。
定义集合 \mathcal{F}_ 0 为所有满足 x_i\mid f_i,(f_i/x_i)(\mathbf 0)\neq 0 的 \mathbf{f} 构成的集合,则多元 Lagrange 反演的适用范围就是 \mathcal F_0 。
定义集合 \mathcal{F}_ 1 为所有满足 o(f_i - x_i) \geq 2 的 \mathbf{f} 构成的集合,这是 A-G 反演公式的适用范围。可以发现 \mathcal F_0\subsetneq\mathcal F_1 ,因此我们下面要讲的 A-G 反演公式推广了多元 Lagrange 反演。
下面是多重指标的一些基本定义。
我们再简要介绍一下微分算子,定义 \partial_i = \frac{\partial}{\partial x_i} ,例如 \partial_i (x_j) = [i=j] 。微分算子是形如
\sum_{\alpha\in\mathbb N^n}A_\alpha\partial^{\alpha}
的算子。为了保证这个无穷求和会收敛,其实我们应该加上一个条件:\lim_{|\alpha|\rightarrow\infty}[o(A_\alpha)-|\alpha|]=\infty ,不过这不在我们的讨论范围内,因为后面用到的微分算子都是收敛的。
根据 Leibniz 公式可知,形如 \sum_{\alpha\in\mathbb N^n}\partial^{\alpha}B_\alpha 的算子也是微分算子。并且微分算子之和、之积(即复合)也是微分算子。但需要注意,微分算子的乘法不一定满足交换律,例如 \phi = x \partial_y,\psi= y \partial_x ,作用在 u = x^2 y 上有 \phi\psi u=\phi(2xy^2)=4x^2y,\psi\phi u=\psi(x^3)=3x^2y ,是不一样的。
定理证明
性质 1 . 对于任意 \mathbf{f} \in \mathcal{F}_ 1 ,存在唯一的向量 \mathbf{a} = (a_1, \dots, a_n) \in k[[\mathbf{x}]]^n ,满足 o(\mathbf{a}) \geq 2 ,且使得
\mathbf{f} = \exp(\mathbf{a} \partial) \mathbf{x},
其中 \mathbf{a} \partial = \sum_{i=1}^n a_i \partial_i 是微分算子,其在向量值函数上的作用定义为分别作用于每个分量,且 \exp(\mathbf{a} \partial) 是指数映射(由 Taylor 级数定义)。等价地,对每个 i ,有 f_i = \exp(\mathbf{a} \partial) x_i 。
证明 . 我们通过构造法证明 \mathbf{a} 的存在唯一性。核心思想是将 \mathbf{f} 和 \mathbf{a} 分解为齐次分量,并从低次到高次逐次确定 \mathbf{a} 的分量。具体如下。
第一步,我们做齐次分解,设 \mathbf{f} = \sum_{i=1}^{\infty} \mathbf{g}_ i ,其中每个 \mathbf{g}_ i 是齐 i 次的向量(即 o(\mathbf{g}_ i) = O(\mathbf{g}_ i) = i ),且由 \mathcal{F}_ 1 的定义知 \mathbf{g}_ 1 = \mathbf{x} 。类似地,设 \mathbf{a} = \sum_{i=2}^{\infty} \mathbf{b}_ i ,其中每个 \mathbf{b}_ i 是齐 i 次的向量。我们的目标是归纳地找出每个 \mathbf{b}_ i 。
第二步,我们考虑指数映射的展开。回顾 \exp(\mathbf{a} \partial) \mathbf{x} = \sum_{j=0}^{\infty} \frac{(\mathbf{a} \partial)^j}{j!} \mathbf{x} ,一个关键观察是,当 j \geq 1 时,算子 \frac{(\mathbf{a} \partial)^j}{j!} 作用在 \mathbf{x} 上会提升阶数。具体地,因为 \mathbf{x} 的阶数为 1 ,且每次应用微分算子 \mathbf{a} \partial 至少增加阶数 1 (因 o(\mathbf{a}) \geq 2 ,且微分降低阶数 1 ),所以 o( \frac 1{j!}{(\mathbf{a} \partial)^j} \mathbf{x} ) \geq j + 1 。这意味着在计算 \mathbf b_i 时,只需考虑展开式中 j \leq i-1 的部分。
第三步,我们开始归纳构造。当 i=2 时,比较 \mathbf{f} = \exp(\mathbf{a} \partial) \mathbf{x} 两边阶数为 2 的项,可得 \mathbf b_2=\mathbf g_2 。而当 i\ge 3 时,假设 \mathbf{b}_ 2, \dots, \mathbf{b}_ {i-1} 已被唯一确定,记 \mathbf b' = \sum_{j=2}^{i-1} \mathbf{b}_ j 。要得到 \mathbf b_i ,我们完全可以忽略次数高于 i 的项,即 (\mathbf a\partial)^j\mathbf x=(\mathbf b'\partial+\mathbf b_i\partial)^j\mathbf x+\cdots 。而对于 j\ge 2,l\ge 1 ,我们有 o((\mathbf b'\partial)^{j-l}(\mathbf b_i\partial)^l\mathbf x)\ge (j-l)+l(i-1)+1\ge i+1 ,也是可以忽略掉的。所以就有
\sum_{j=1}^{i}\mathbf g_j+\cdots=\mathbf x+\mathbf b'+\mathbf b_i+\sum_{j=2}^{i-1}\frac{1}{j!}(\mathbf b'\partial)^j\mathbf x+\cdots.
那么 \mathbf b_i 的存在唯一性也就显然了。
综上,\mathbf{a} = \sum_{i=2}^{\infty} \mathbf{b}_ i 存在且唯一。\Box
性质 1 允许我们将向量值幂级数写为微分算子的指数映射的形式,下面这个性质则会告诉我们这样改写的优势所在。
性质 2 . 对于 \mathbf f\in\mathcal F_1 ,设 \mathbf f=\exp(\mathbf a\partial)\mathbf x ,则任给 u\in k[[\mathbf x]] ,我们总有
u(\mathbf f)=\exp(\mathbf a\partial)u(\mathbf x).
特别地,任给 k\in\mathbb Z ,定义 \mathbf f^{[k]}(\mathbf x) 为 \mathbf f 的 k 次复合,若 k<0 则定义为其反函数的 -k 次复合,那么有
\mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x.
证明 . 要证明 u(\mathbf f)=\exp(\mathbf a\partial)u(\mathbf x) ,只需证明 \exp(\mathbf a\partial) 是 k[[\mathbf x]] 上的同态。记 A=\mathbf a\partial ,显然 e^A(g+h)=e^Ag+e^Ah ,以下证明 e^A(gh)=(e^Ag)(e^Ah) 。
因为 \mathbf a\partial 满足 Leibniz 律,所以有 Leibniz 公式 (\mathbf a\partial)^k(gh)=\sum_i\binom ki[(\mathbf a\partial)^ig][(\mathbf a\partial)^{k-i}h] ,于是
\begin{aligned}\exp(\mathbf a\partial)(gh)&=\sum_{k\ge 0}\frac 1{k!}(\mathbf a\partial)^k(gh)\\&=\sum_{k\ge 0}\frac 1{k!}\sum_{i\ge 0}\binom ki[(\mathbf a\partial)^ig][(\mathbf a\partial)^{k-i}h]\\&=\sum_{k,i\ge 0}\frac {[(\mathbf a\partial)^ig]}{i!}\frac{[(\mathbf a\partial)^{k-i}h]}{(k-i)!}\\&=[\exp(\mathbf a\partial)g][\exp(\mathbf a\partial)h],\end{aligned}
即 g\mapsto e^Ag 是同态,故有 u(\mathbf f)=e^Au 。
由此可以归纳得到,如果 k\ge 0 且 \mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x ,则
\mathbf f^{[k+1]}=\mathbf f(\mathbf f^{[k]})=\exp(k\mathbf a\partial)\mathbf f=\exp(k\mathbf a\partial)\exp(\mathbf a\partial)\mathbf x=\exp((k+1)\mathbf a\partial)\mathbf x.
若 k<0 ,记 \mathbf g=\exp(-\mathbf a\partial)\mathbf x ,显然 \mathbf g\circ \mathbf f=\mathbf f\circ\mathbf g=\mathbf {id} ,且
\mathbf f^{[k]}=\mathbf g^{[-k]}=\exp((-k)(-\mathbf a\partial ))\mathbf x=\exp(k\mathbf a\partial )\mathbf x.
这表明 \mathbf f^{[k]}=\exp(k\mathbf a\partial)\mathbf x 对任意的整数 k 总是成立的。\Box
性质 2 的结论启发我们延拓复合幂的定义,以下令 \mathbf f^{[t]}=\exp(t\mathbf a\partial)\mathbf x\in k[[t,\mathbf x]]^n 。
性质 3 . 对于 \mathbf f\in\mathcal F_1 ,设 \mathbf f=\exp(\mathbf a\partial)\mathbf x ,则 \mathbf f^{[t]} 的 Jacobi 行列式
\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)1.
其中 \nabla\mathbf a=\sum_i (\partial _ ia_i) 。且任给 u\in k[[\mathbf x]] ,总有
u(\mathbf f^{[t]})\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)u.
证明 . 记 K(t)=\det J(\mathbf f^{[t]}),H(t)=\exp(t\mathbf a\partial+t\nabla\mathbf a)1 ,则 H(t) 为以下微分方程的唯一解:
\begin{cases}H(0)=1,\\ H'(t)=(\mathbf a\partial+\nabla \mathbf a)H(t).\end{cases}
因此,要证明 K=H ,只需证明 K 也满足以上两式。K(0)=\det J(\mathbf f^{[0]})=\det J(\mathbf{id})=1 ,以下求 K'(t) 。
设 \mathbf f^{[t]}=(f_1^{[t]},f_2^{[t]},\cdots,f_n^{[t]}) ,则 f_i^{[t]}=\exp(t\mathbf a\partial)x_i 。因为行列式求导等于逐列求导并相加,所以
\vdots &\ddots&\vdots\\
\partial_1f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}=\sum_{i=1}^n\begin{vmatrix}\partial_1f_1^{[t]}&...&\partial_t\partial_if_1^{[t]}&...&\partial_nf_1^{[t]}\\
\partial_1f_2^{[t]}&...&\partial_t\partial_if_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &&\vdots&&\vdots\\
\partial_1f_n^{[t]}&...&\partial_t\partial_if_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}.
记 A=\mathbf a\partial ,我们以 i=1 为例,演示如何计算后面这些行列式。注意区分 A,\nabla \mathbf a ,前者是导子,后者只是一个幂级数。
\partial_t\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
\partial_t\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}&=\begin{vmatrix}\partial_1(A f_1^{[t]})&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\
\partial_1(A f_2^{[t]})&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
\partial_1(A f_n^{[t]})&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}\\&=\begin{vmatrix} \sum _ i(\partial_1 a_i) (\partial_if_1^{[t]})&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\
\sum _ i(\partial_1 a_i) (\partial_if_2^{[t]})&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
\sum _ i(\partial_1 a_i) (\partial_if_n^{[t]})&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}+\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\
A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}\\&=\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\
A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}+\sum _ i(\partial_1 a_i) \begin{vmatrix} \partial_if_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\\partial_if_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
\partial_if_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}\\&=\begin{vmatrix}A \partial_1f_1^{[t]}&\partial_2f_1^{[t]}&...&\partial_nf_1^{[t]}\\
A\partial_1f_2^{[t]}&\partial_2f_2^{[t]}&...&\partial_nf_2^{[t]}\\
\vdots &\vdots&\ddots&\vdots\\
A\partial_1f_n^{[t]}&\partial_2f_n^{[t]}&...&\partial_nf_n^{[t]}
\end{vmatrix}+(\partial_1a_1)\det J(\mathbf f^{[t]}).\end{aligned}
故有 K'(t)=A\det J(\mathbf f^{[t]})+\nabla\mathbf a\det J(\mathbf f^{[t]})=(\mathbf a\partial+\nabla \mathbf a)K(t) ,即 K=H 。
至于 u(\mathbf f^{[t]})\det J(\mathbf f^{[t]})=\exp(t\mathbf a\partial+t\nabla\mathbf a)u ,也可以通过证明两端满足同个微分方程来得到,留给读者完成。提示:\partial _ t u(\mathbf f^{[t]})=(\mathbf a\partial )u(\mathbf f^{[t]}) 。\Box
下面我们引入一个重要的线性映射 \tau ,它将微分算子映射为微分算子。定义为
\tau(h(\mathbf x)\partial^\alpha)=(-1)^{|\alpha|}\partial^\alpha h(\mathbf x).
我们可以这样理解,它交换了乘法和求导的先后顺序,并改变了符号。它有如下类似于矩阵转置的性质。
性质 4 . \tau 是反对合映射,也就是说,\tau^2=id ,且任给微分算子 \phi,\psi ,有 \tau(\phi\psi)=\tau(\psi)\tau(\phi) (注意 \psi,\phi 的顺序)。
证明 .
\begin{aligned}\tau^2(h\partial^\alpha)&=\tau((-1)^{|\alpha|}\partial^\alpha h)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|}\tau((\partial^{\alpha-\beta}h)\partial^\beta)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|-|\beta|}\partial^\beta(\partial^{\alpha-\beta}h)\\&=\sum_{\beta\le \alpha}\binom\alpha\beta(-1)^{|\alpha|-|\beta|}\sum_{\gamma\le \beta}\binom{\beta}{\gamma}(\partial^{\alpha-\gamma}h)\partial^\gamma\\&=\sum_{\gamma\le \alpha}\binom{\alpha}{\gamma}(\partial^{\alpha-\gamma}h)\partial^\gamma\sum_{\beta}\binom{\alpha-\gamma}{\alpha-\beta}(-1)^{|\alpha|-|\beta|}\\&=h\partial^\alpha.\end{aligned}
第二条只需设 \phi=h\partial^\alpha,\psi=g\partial^\beta 去验证就好了,留给读者。验证时注意等式两边可以消掉的要及时消掉,不然计算量很大。\Box
到这里我们所有准备工作都完成了,下面开始证明 A-G 反演公式。
定理 5 . 设 \mathbf f,\mathbf g\in\mathcal F_1 ,记 \mathbf h=\mathbf x-\mathbf g ,若 \mathbf f\circ\mathbf g=\mathbf {id} ,则任给 u\in k[[\mathbf x]] ,有
u(\mathbf f)=\sum_{ \alpha}\frac 1{\alpha!}\partial ^\alpha ( u\, \mathbf h^\alpha \det J(\mathbf g)).
证明 . 根据性质 1 和性质 2,设
\mathbf f=\exp(\mathbf a\partial)\mathbf x,\quad \mathbf g=\exp(-\mathbf a\partial)\mathbf x.
记 A=\mathbf a\partial ,则 u(\mathbf g)=e^{-A}u 。
另一方面,根据 \mathbf h=\mathbf x-\mathbf g ,我们在 \mathbf x 处对 u 作 Taylor 展开:
u(\mathbf g)=\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha u.
相减可得 (e^{-A}-\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha)u=0 。
又因为这个式子对于任意的 u 都成立,所以微分算子必为 0 ,即
e^{-A}=\sum_{\alpha}\frac {(-1)^{|\alpha|}}{\alpha!}\mathbf h^\alpha\partial^\alpha.
将 \tau 作用在此式两端可得:
\tau(e^{-A})=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha.
因为 \tau 是反对合的,所以 \tau(\phi^k)=\tau(\phi)^k ,故有 \tau(e^{-A})=e^{-\tau(A)} 。回忆 A=\sum_i a_i\partial_i ,我们有
e^{-\tau(A)}=\exp\left({\sum_i\partial_ia_i}\right)=\exp(A+\nabla\mathbf a).
由此可得 \exp(A+\nabla\mathbf a)=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha 。
根据性质 3,令 t=1 得 v(\mathbf f)\det J(\mathbf f)=\exp(\mathbf a\partial+\nabla\mathbf a)v 。再令 v=u\det J(\mathbf g) 可得
u(\mathbf f)=u(\mathbf f)(\det J(\mathbf g)|_{\mathbf x=\mathbf f})\det J(\mathbf f)=\sum_{\alpha}\frac {1}{\alpha!}\partial^\alpha\mathbf h^\alpha u\det J(\mathbf g).
最后一个等号是因为 (\det J(\mathbf g)|_{\mathbf x=\mathbf f}) \det J(\mathbf f) = \det J(\mathbf g \circ \mathbf f) = \det J(\mathbf{id}) = 1 。\Box
简单应用
我们之前提过,若只考虑形式幂级数,则 A-G 反演公式严格强于多元 Lagrange 反演,这里我们试着用 A-G 反演推 Lagrange 反演。
推论 6 . 对于 \mathbf f,\mathbf g\in \mathcal F_0 ,以及 u\in k[[\mathbf x]] ,若 \mathbf f\circ\mathbf g=\mathbf{id} ,则任给 \alpha\in\mathbb N^n ,有
[\mathbf x^\alpha] u(\mathbf f)=[\mathbf x^{-\mathbf 1}]\frac{u}{\mathbf g^{\alpha+\mathbf 1}}\det J(\mathbf g).
证明 . 根据定理 5,设 \mathbf h=\mathbf x-\mathbf g ,则
\begin{aligned}[\mathbf x^\alpha]u(\mathbf f)&=\sum_{ \beta}\frac 1{\beta!}[\mathbf x^\alpha]\partial ^\beta ( u\, \mathbf h^\beta \det J(\mathbf g))\\&=\sum_{ \beta}\binom {\alpha+\beta}{\alpha}[\mathbf x^{\alpha+\beta}] u\, \mathbf (\mathbf x-\mathbf g)^\beta \det J(\mathbf g)\\&=[\mathbf x^{\alpha}]\sum_{ \beta}\binom {\alpha+\beta}{\alpha} (\mathbf 1-\mathbf g/\mathbf x)^\beta u\det J(\mathbf g)\\&=[\mathbf x^{\alpha}] \frac 1{(\mathbf g/\mathbf x)^{\alpha+\mathbf 1}}u\det J(\mathbf g)\\&=[\mathbf x^{-\mathbf 1}]\frac{u}{\mathbf g^{\alpha+\mathbf 1}}\det J(\mathbf g).\ \Box\end{aligned}
最后,作为结尾,我们以之前给的一道思考题来举例说明 A-G 反演公式的应用。
推论 7 . 若 f\in k[[x,y]] 满足 f(0,0)=0,f(x,y)-[f(y,x)]^2=x ,则
f(x,y)=\sum_{a,b\ge 0}\binom{2a}{b}\binom{2b+1}{a}x^{2b-a+1}y^{2a-b}-4\sum_{a,b\ge 0}\binom{2a+1}{b}\binom{2b+2}{a}x^{2b-a+2}y^{2a-b+1}.
证明 . 容易证明若设 \mathbf f=(f(x,y),f(y,x)) ,则 \mathbf f\in\mathcal F_1 ,且令 \mathbf g=(x-y^2,y-x^2) ,有 \mathbf g\circ\mathbf f=\mathbf {id},\mathbf h=(x,y)-\mathbf g=(y^2,x^2) 。取 u(x,y)=x ,根据定理 5 可得
f(x,y)=\sum_{a,b\ge 0}\frac 1{a!b!}\partial_x^a\partial_y^b ( x\, y^{2a}x^{2b}(1-4xy)).
稍微整理一下即得答案。\Box
当然,这道题也有别的做法,就是硬套四次求根公式。但很显然,既不优雅,也不好算,更难扩展。
对了,有没有人给这个公式来个组合证明(