杨表学习笔记

rui_er · 2023-01-24 16:17:32 · 算法·理论

杨表学习笔记

简介

更好的阅读体验（其中折叠了例题的题解和代码）。

杨表（Young tableau）是一种常用于表示论和舒伯特演算中的组合对象，在数学中被用于对称群和一般线性群的研究。阿尔弗雷德·杨（Alfred Young）于 1900 年提出了杨表。

杨图

定义

杨图（Young diagram）又称 Ferrers 图，是一个有限的单元格集合，其中每一行左对齐，且每一行的长度不严格递减（也有一种画法是不严格递增）。

设杨图的总单元格数为 n，则每一行的格数构成了 n 的一种整数分拆 \lambda。我们可以用 \lambda 表示杨图。

例如，\lambda=(5,4,1) 的杨图如下：

杨图中的每一个单元格用行数和列数唯一确定。在本文的画法中，行数、列数分别是从上往下、从左往右数；而在刚刚提到的另一种画法中，行数是从下往上数。换句话说，行数按单元格数从多到少的方向，列数从左对齐的方向。

对于 n 个单元格的杨图 \lambda 和 n-1 个单元格的杨图 \mu，若 \exists j,\textrm{s.t.}\forall i\ne j,\lambda_i=\mu_i,\lambda_j=\mu_j+1，记 \mu\uparrow\lambda。

臂长、腿长、勾长

杨图的每个单元格 (x,y) 有臂长（arm length）、腿长（leg length）、勾长（hook length）：

臂长为这个单元格右面的单元格个数，记作 a_\lambda(x,y)。
腿长为这个单元格下面的单元格个数，记作 l_\lambda(x,y)。
勾长为这个单元格及其右面、下面的单元格总数，记作 h_\lambda(x,y)。由定义有 h_\lambda(x,y)=a_\lambda(x,y)+l_\lambda(x,y)+1。

杨表

定义

杨表（Young tableau）是用某个字母表的符号填充杨图得到的，字母表通常需要是全序集合。为了方便，一般填入正整数。

标准杨表（standard Young tableau）是满足每列数字严格递增、每行数字严格递增的杨表。

半标准杨表（semistandard / column-strict Young tableau）是满足每列数字严格递增、每行数字非严格递增的杨表。

标准杨表的 RSK 插入算法

RSK 插入算法由 Robinson、Schensted、Knuth 提出，它可以将杨表和排列联系起来。

要将 k 插入杨表 S 中，算法流程如下：

移动到第一行。
在该行中找到比 k 大的最小数 k'。
如果 k' 存在，将原本是 k' 的单元格替换为 k，然后令 k\gets k'，移动到下一行并重复步骤二。
如果 k' 不存在，将 k 放到该行末尾。

容易证明在上述算法过后，S 仍然是标准杨表。

杨表性质

将排列 p_1,p_2,\cdots,p_n 按 RSK 插入算法依次插入得到杨表 S，有性质：

第一行长度 S_1 为排列的 LIS 长度（内容不一定）。
第一列长度为排列的 LDS 长度（内容不一定）。
若将排列 p_n,p_{n-1},\cdots,p_1 插入杨表 S'，则 S' 是 S 交换行列得到。
更换全序集合的比较方式 \prec 为 \succ，杨表 S' 的形状是 S 交换行列得到（内容不一定）。

一些结论

勾长公式（hook length formula）

设有 n 个单元格的杨图 \lambda，在其中填入 1\sim n 的排列，得到的标准杨表数为 d_\lambda，则有：

d_\lambda=\frac{n!}{\prod h_\lambda(i,j)}

例如，对于杨图 \lambda=(5,4,1)，有：

d_\lambda=\frac{10!}{7\cdot 5\cdot 4\cdot 3\cdot 1\cdot 5\cdot 3\cdot 2\cdot 1\cdot 1}=288

证明：（参考杨表和钩子公式）

设 c_1,\cdots,c_m 为 h_\lambda(x,y)=1 的单元格，记 \mu_i=\lambda/\{c_i\}，则 \{\mu_1,\cdots,\mu_m\}=\{\mu\mid\mu\uparrow\lambda\}。

显然 d_\lambda=\sum\limits_{\mu\uparrow\lambda}d_\mu。设 e_\lambda=\frac{n!}{\prod h_\lambda(i,j)}，我们规定 d_\emptyset=e_\emptyset=1，只需证明 e_\lambda=\sum\limits_{\mu\uparrow\lambda}e_\mu 即可归纳得 d_\lambda=e_\lambda。

对 e_\lambda=\sum\limits_{\mu\uparrow\lambda}e_\mu 变形得 \sum\limits_{i=1}^m\frac{e_{\mu_i}}{e_\lambda}=1。

定义勾行走（hook walk）：

随机选取单元格 (x,y)\in\lambda 作为起点。
每次从 (x,y) 等概率地走到它下面、右面的共 h_\lambda(x,y)-1 格中的一个随机格子。
若不能再行走（即走到某个 c_i），则行走结束。

设随机事件 A_i 表示终点为 c_i，显然有 \sum\limits_{i=1}^mP(A_i)=1，只需证 P(A_i)=\frac{e_{\mu_i}}{e_\lambda}。

注意到 h_\lambda(x,y)+h_\lambda(x+1,y+1)=h_\lambda(x+1,y)+h_\lambda(x,y+1)，构造矩阵 h：

\begin{cases} h_{0,0}=0\\ h_{x,0},h_{0,y}\in\mathbb{N}^*\\ h_{x,y}=h_{x-1,y}+h_{x,y-1}-h_{x-1,y-1}\\ \end{cases}

构造矩阵 p：

\begin{cases} p_{0,0}=1\\ p_{x,y}=\frac{1}{h_{x,y}}\left(\sum\limits_{i=0}^{x-1}p_{i,y}+\sum\limits_{j=0}^{y-1}p_{x,j}\right)\\ \end{cases}

引理：\sum\limits_{i=0}^x\sum\limits_{j=0}^yp_{i,j}=\prod\limits_{i=0}^x\left(1+\frac{1}{h_{i,0}}\right)\prod\limits_{j=0}^y\left(1+\frac{1}{h_{0,j}}\right)。

证明：

容易验证 x,y\in\{0,1\} 成立。

有 h_{x,y}=h_{x,0}+h_{0,y}。设 S(x,y)=\sum\limits_{i=0}^x\sum\limits_{j=0}^yp_{i,j}，可以归纳知 S(x,0) 和 S(0,y) 时上式成立。

若 S(x-1,y),S(x,y-1),S(x-1,y-1) 上式均成立，则：

\begin{aligned} S(x,y)&=S(x-1,y)+S(x,y-1)-S(x-1,y-1)+p_{x,y}\\ &=S(x-1,y-1)\left(1+\frac{1}{h_{0,y}}+1+\frac{1}{h_{x,0}}-1\right)+\frac{1}{h_{x,y}}\left(\sum\limits_{i=0}^{x-1}p_{i,y}+\sum\limits_{j=0}^{y-1}p_{x,j}\right)\\ &=S(x-1,y-1)\left(1+\frac{1}{h_{0,y}}+\frac{1}{h_{x,0}}\right)+\frac{1}{h_{x,y}}(S(x-1,y)+S(x,y-1)-2S(x-1,y-1))\\ &=S(x-1,y-1)\left(1+\frac{1}{h_{0,y}}+\frac{1}{h_{x,0}}+\frac{1}{h_{x,0}+h_{0,y}}\left(\frac{1}{h_{0,y}}+\frac{1}{h_{x,0}}\right)\right)\\ &=S(x-1,y-1)\left(1+\frac{1}{h_{0,y}}\right)\left(1+\frac{1}{h_{x,0}}\right)\\ &=\prod\limits_{i=0}^x\left(1+\frac{1}{h_{i,0}}\right)\prod\limits_{j=0}^y\left(1+\frac{1}{h_{0,j}}\right)\\ \end{aligned}

引理得证。\square

对于任意 (x_0,y_0)，令 h_{x,0}=h_\lambda(x_0-x,y_0)-1,h_{0,y}=h_\lambda(x_0,y_0-y)-1，则有 h_{x,y}=h_\lambda(x_0-x,y_0-y)-1，p_{x,y} 为从 (x_0-x,y_0-y) 走到 (x_0,y_0) 的概率。

令 (x_0,y_0)=c_i，则：

\begin{aligned} P(A_i)&=\frac{1}{n}\sum\limits_{x=0}^{x_0-1}\sum\limits_{y=0}^{y_0-1}p_{x,y}\\ &=\frac{1}{n}\prod\limits_{x=0}^{x_0-1}\left(1+\frac{1}{h_\lambda(x_0-x,y_0)-1}\right)\prod\limits_{y=0}^{y_0-1}\left(1+\frac{1}{h_\lambda(x_0,y_0-y)-1}\right)\\ &=\frac{\prod\limits_{x=0}^{x_0-1}h_\lambda(x_0-x,y_0)\prod\limits_{y=0}^{y_0-1}h_\lambda(x_0,y_0-y)}{n\prod\limits_{x=0}^{x_0-1}(h_\lambda(x_0-x,y_0)-1)\prod\limits_{y=0}^{y_0-1}(h_\lambda(x_0,y_0-y)-1)}\\ &=\frac{e_{\mu_i}}{e_\lambda} \end{aligned}

\square

Robinson–Schensted correspondence

任意两个相同形状的杨表（填数可能不同），可以与排列建立一一对应。

即：

\sum\limits_{\lambda\in\mathcal P_n}(d_\lambda)^2=n!

其中 \mathcal P_n 为 n 的所有分拆数，有结论 |\mathcal P_n|\sim\frac{1}{4\sqrt{3}n}\textrm{e}^{\sqrt{\frac{2n}{3}}\pi}（A000041）。

排列到双杨表的映射：

维护插入杨表 P 和记录杨表 Q。

依次枚举排列 p 中的元素 p_i，使用 RSK 插入算法将其插入 P 中。此时 P 中多了一个单元格，在 Q 的相同位置添加一个单元格并填入 i。

例如，p=[1,5,7,2,8,6,3,4] 得到的两个杨表如下：

双杨表到排列的映射：

根据填数从大到小枚举 Q 的单元格，从后往前确定排列 p。

枚举到一个单元格，在 P 中找到对应的单元格。若在第一行则直接删除，否则在上一行找到比它小的最大数，将它放到那里并继续删除被替换的数。

其实就是 RSK 插入算法的逆过程。

题目

CF1268B Domino for Young

给定一个杨图，求最多放多少不重叠的骨牌。

**题解** 黑白染色，答案为更少的那种颜色个数。引理：黑白相等的杨图可以被骨牌密铺。证明：放一个骨牌相当于删除两个相邻单元格。若杨图为空，显然成立。假设杨图有黑白格各 $m-1$ 个时成立，下证黑白格各 $m$ 个时成立。若杨图存在两行格数相等，或存在两列格数相等，可以删除行/列末尾各一个单元格。显然可以找到这样的一对单元格，使得存在一个单元格 $(x,y)$ 满足 $h_\lambda(x,y)=1$，从而使得剩余部分仍然是杨图。否则，$\lambda=(k,k-1,\cdots,2,1)$ 黑白格数必然不等。 $\square

当黑白不相等时，先按上述过程删成 \lambda=(k,k-1,\cdots,2,1)，我们删除顶端的格子然后继续做即可。显然顶端的格子一定是更多的那种颜色。

\square

复杂度为 \mathcal O(n)。

代码

// Problem: CF1268B Domino for Young
// Contest: Luogu
// URL: https://www.luogu.com.cn/problem/CF1268B
// Memory Limit: 250 MB
// Time Limit: 3000 ms
// 
// Powered by CP Editor (https://cpeditor.org)

//By: OIer rui_er
#include <bits/stdc++.h>
#define rep(x,y,z) for(ll x=(y);x<=(z);x++)
#define per(x,y,z) for(ll x=(y);x>=(z);x--)
#define debug printf("Running %s on line %d...\n",__FUNCTION__,__LINE__)
#define fileIO(s) do{freopen(s".in","r",stdin);freopen(s".out","w",stdout);}while(false)
using namespace std;
typedef long long ll;
const ll N = 3e5+5;

ll n, a[N], cnt[2];
template<typename T> void chkmin(T& x, T y) {if(x > y) x = y;}
template<typename T> void chkmax(T& x, T y) {if(x < y) x = y;}

int main() {
    scanf("%lld", &n);
    rep(i, 1, n) {
        scanf("%lld", &a[i]);
        cnt[i&1] += a[i] >> 1;
        cnt[(i&1)^1] += a[i] - (a[i] >> 1);
    }
    printf("%lld\n", min(cnt[0], cnt[1]));
    return 0;
}

P4484 [BJWC2018]最长上升子序列

求长度为 n 的随机排列 LIS 长度的期望。

**题解** 根据上文 Robinson–Schensted correspondence 中设计的映射算法，我们可以将排列一一对应为一对相同形状的杨表，其中杨表的第一行长度为 LIS 长度。而对于杨图 $\lambda$，其杨表种类数为 $d_\lambda$，一对这种形状的杨表种类数为 $(d_\lambda)^2$，杨表第一行长度为 $\lambda_1$。于是所求被我们转化为： $$ \frac{1}{n!}\sum\limits_{\lambda\in\mathcal P_n}(d_\lambda)^2\lambda_1 $$ 我们有勾长公式，可以在 $\mathcal O(n)$ 时间计算 $d_\lambda$： $$ d_\lambda=\frac{n!}{\prod h_\lambda(i,j)} $$ 另外前文提到，$|\mathcal P_n|\sim\frac{1}{4\sqrt{3}n}\textrm{e}^{\sqrt{\frac{2n}{3}}\pi}$，可以直接枚举。于是复杂度为 $\mathcal O(n|\mathcal P_n|)$。 **代码** ```cpp // Problem: P4484 [BJWC2018]最长上升子序列 // Contest: Luogu // URL: https://www.luogu.com.cn/problem/P4484 // Memory Limit: 500 MB // Time Limit: 1000 ms // // Powered by CP Editor (https://cpeditor.org) //By: OIer rui_er #include <bits/stdc++.h> #define rep(x,y,z) for(ll x=(y);x<=(z);x++) #define per(x,y,z) for(ll x=(y);x>=(z);x--) #define debug(format...) fprintf(stderr, format) #define fileIO(s) do{freopen(s".in","r",stdin);freopen(s".out","w",stdout);}while(false) using namespace std; typedef long long ll; const ll N = 30, mod = 998244353; ll n, inv[N], fac, ifac, a[N], cnt[N], ans; template<typename T> void chkmin(T& x, T y) {if(x > y) x = y;} template<typename T> void chkmax(T& x, T y) {if(x < y) x = y;} ll calc(ll m) { ll ans = fac; rep(i, 1, m) rep(j, 1, a[i]) ans = ans * inv[a[i]-j+cnt[j]-i+1] % mod; return ans; } void dfs(ll u, ll rem, ll lim) { if(!rem) { ll now = calc(u-1); ans = (ans + now * now % mod * a[1] % mod) % mod; return; } rep(i, 1, min(rem, lim)) { a[u] = i; ++cnt[i]; dfs(u+1, rem-i, i); } rep(i, 1, min(rem, lim)) --cnt[i]; } int main() { scanf("%lld", &n); fac = ifac = inv[0] = inv[1] = 1; rep(i, 2, n) { fac = fac * i % mod; inv[i] = (mod - mod / i) * inv[mod%i] % mod; ifac = ifac * inv[i] % mod; } dfs(1, n, n); ans = ans * ifac % mod; printf("%lld\n", ans); return 0; } ``` ### [P3774 \[CTSC2017\]最长上升子序列](https://www.luogu.com.cn/problem/P3774) 给定长度为 $n$ 的数列 $a$，进行 $m$ 次询问，每次询问一个 $a$ 的 $1\sim m$ 前缀的最长的满足 LIS 长度不超过 $k$ 的子序列长度。 $1\le n\le 5\times 10^4$，$1\le m\le 2\times 10^5$。 **题解·上（$95$ 分）** 考虑扫描线，对询问按照 $m$ 升序离线，每次加入一个数，问题转化为求当前数列的最长的满足 LIS 长度不超过 $k$ 的子序列长度。根据 Dilworth 定理（或者是对偶定理？分不清楚），对于有限偏序集，最长链中元素个数等于最小反链划分中反链个数。我们可以知道 LIS 长度不超过 $k$ 等价于用不超过 $k$ 个 DS 覆盖，从而将所求转化为杨表的前 $k$ 列元素个数。我们使用 RSK 插入算法维护杨表。这里虽然不是标准杨表，但是可以改造该算法使其能维护半标准杨表。然后使用树状数组维护每一列元素个数。注意到 RSK 插入算法的复杂度为 $\mathcal O(|\lambda|\log n)$，因此这个算法的最坏复杂度为 $\mathcal O(n^2\log n+m\log n)$，实际得分 $95$ 分。 **代码·上（$95$ 分）** ```cpp // Problem: P3774 [CTSC2017]最长上升子序列 // Contest: Luogu // URL: https://www.luogu.com.cn/problem/P3774 // Memory Limit: 500 MB // Time Limit: 1000 ms // // Powered by CP Editor (https://cpeditor.org) //By: OIer rui_er #include <bits/stdc++.h> #define rep(x,y,z) for(int x=(y);x<=(z);x++) #define per(x,y,z) for(int x=(y);x>=(z);x--) #define debug(format...) fprintf(stderr, format) #define fileIO(s) do{freopen(s".in","r",stdin);freopen(s".out","w",stdout);}while(false) using namespace std; typedef long long ll; const int N = 2e5+5; int n, m, a[N], ans[N]; vector<vector<int>> young; template<typename T> void chkmin(T& x, T y) {if(x > y) x = y;} template<typename T> void chkmax(T& x, T y) {if(x < y) x = y;} struct Query { int m, k, id; }q[N]; struct BIT { int c[N]; int lowbit(int x) {return x & (-x);} void add(int x, int k) {for(; x < N; x += lowbit(x)) c[x] += k;} int ask(int x) {int k = 0; for(; x; x -= lowbit(x)) k += c[x]; return k;} }cnt; void insert(int x) { int sz = young.size(); if(!sz) { young.push_back({x}); cnt.add(1, 1); } else { for(auto& i : young) { auto it = lower_bound(i.begin(), i.end(), x); if(it == i.end()) { i.push_back(x); cnt.add(i.size(), 1); return; } swap(*it, x); } young.push_back({x}); cnt.add(1, 1); } } int main() { scanf("%d%d", &n, &m); rep(i, 1, n) scanf("%d", &a[i]); rep(i, 1, m) { scanf("%d%d", &q[i].m, &q[i].k); q[i].id = i; } sort(q+1, q+1+m, [](const auto& a, const auto& b) { return a.m < b.m; }); int j = 1; rep(i, 1, n) { insert(a[i]); for(; j <= m && q[j].m == i; j++) ans[q[j].id] = cnt.ask(q[j].k); } rep(i, 1, m) printf("%d\n", ans[i]); return 0; } ``` **题解·下（$100$ 分）** 显然杨表的前 $\sqrt{n}$ 行和前 $\sqrt{n}$ 列可以覆盖整个杨表，考虑维护 $\prec$ 关系的原杨表和 $\succ$ 关系的转置杨表，分别维护前 $\sqrt{n}$ 行。每次加入元素就在两个杨表里同时插入，不过 RSK 插入算法只枚举前 $\sqrt{n}$ 行即可，加到树状数组中的时候处理一下不要加重。复杂度 $\mathcal O(n\sqrt{n}\log n+m\log n)$。 **代码·下（$100$ 分）** ```cpp // Problem: P3774 [CTSC2017]最长上升子序列 // Contest: Luogu // URL: https://www.luogu.com.cn/problem/P3774 // Memory Limit: 500 MB // Time Limit: 1000 ms // // Powered by CP Editor (https://cpeditor.org) //By: OIer rui_er #include <bits/stdc++.h> #define rep(x,y,z) for(int x=(y);x<=(z);x++) #define per(x,y,z) for(int x=(y);x>=(z);x--) #define debug(format...) fprintf(stderr, format) #define fileIO(s) do{freopen(s".in","r",stdin);freopen(s".out","w",stdout);}while(false) using namespace std; typedef long long ll; const int N = 2e5+5; int n, m, B, a[N], ans[N]; vector<vector<int>> youngA, youngR; template<typename T> void chkmin(T& x, T y) {if(x > y) x = y;} template<typename T> void chkmax(T& x, T y) {if(x < y) x = y;} struct Query { int m, k, id; }q[N]; struct BIT { int c[N]; int lowbit(int x) {return x & (-x);} void add(int x, int k) {for(; x < N; x += lowbit(x)) c[x] += k;} int ask(int x) {int k = 0; for(; x; x -= lowbit(x)) k += c[x]; return k;} }cnt; void insertA(int x) { int szA = youngA.size(); if(!szA) youngA.push_back({x}); else { for(auto& i : youngA) { auto it = lower_bound(i.begin(), i.end(), x); if(it == i.end()) { i.push_back(x); if((int)i.size() > B) cnt.add(i.size(), 1); return; } swap(*it, x); } if(szA < B) youngA.push_back({x}); } } void insertR(int x) { int szR = youngR.size(); if(!szR) { youngR.push_back({x}); cnt.add(1, 1); } else { int i = 0; for(auto& r : youngR) { ++i; auto it = upper_bound(r.begin(), r.end(), x, greater<int>()); if(it == r.end()) { r.push_back(x); cnt.add(i, 1); return; } swap(*it, x); } if(szR < B) { youngR.push_back({x}); cnt.add(i+1, 1); } } } void insert(int x) { insertA(x); insertR(x); } int main() { scanf("%d%d", &n, &m); B = sqrt(n); rep(i, 1, n) scanf("%d", &a[i]); rep(i, 1, m) { scanf("%d%d", &q[i].m, &q[i].k); q[i].id = i; } sort(q+1, q+1+m, [](const auto& a, const auto& b) { return a.m < b.m; }); int j = 1; rep(i, 1, n) { insert(a[i]); for(; j <= m && q[j].m == i; j++) ans[q[j].id] = cnt.ask(q[j].k); } rep(i, 1, m) printf("%d\n", ans[i]); return 0; } ``` ### 其他题目 - [Triomino Tiling](https://www.hackerrank.com/contests/infinitum12/challenges/triomino-tiling) - [CC-BB Billboards](https://www.codechef.com/problems/BB?tab=statement)