DP套DP
FLY_lai
·
·
算法·理论
把 DP 过程当作状态进行 DP。DP of DP 一般数据范围不会太大,而且一般是计数题。
DP of DP 的本质是自动机上 DP。 大致上可以写作 dp[\dots][S] 表示外层 DP 进行到 \dots 阶段,内层 DP 对应到 S 阶段。
例一:Hero meet devil
题意:给出串 s 和一个数 m。n=|s|。求对于 i=0\sim n,有多少串 t 满足 |t|=m 且 LCS(s,t)=i。n\le 15,m\le 10^3。
假设我们已经知道这是一道 DP 套 DP 的题目。那么对于 DP套DP,最重要的想法就是考虑内层 DP 是怎么进行的?
在这题,内层 DP 是 "最长公共子序列"。平时做 LCS,一般是 f[i][j]=\max(f[i-1][j],f[i][j-1],f[i-1][j-1]+[s_i=t_j])。
考虑完内层 DP,然后就要考虑怎么把内层 DP 的状态压缩入外层 DP 的状态。
因为 t 是变化的,所以 DP 时拿一维记录目前考虑到 t 的第 i 位了;对应的,考虑拿一维 S 记录此时 f[1\sim n][i] 的值。
DP of DP 中,一般数据量较小的那一边作为被压缩的内层 DP。 比如这题,n\le 15,用 S 记录就只用压缩长度 15 的数组了。
但是我们面临第二个问题:怎么用 S 记录此时 f[1\sim n][i] 的值?总不可能开十五维数组。这个点也是大部分 DP of DP 的难点,怎么压缩内层 DP 的状态?这里需要一些神秘的观察。
观察:当 j 固定,f[x+1][j]-f[x][j]\in \{0,1\}。
证明:
按 j 的大小数学归纳法。j=1 显然。
若 f[x+1][j]=f[x][j],立即成立。
若 f[x+1][j]=f[x][j-1]+1,又 f[x][j]\ge f[x][j-1],所以 f[x+1][j]-f[x][j]=f[x][j-1]+1-f[x][j]\le f[x][j-1]+1-f[x][j-1]=1。
若 f[x+1][j]=f[x+1][j-1],f[x][j]\ge f[x][j-1],由数学归纳法,f[x+1][j-1]-f[x][j-1]\le 1,所以 f[x+1][j]-f[x][j]\le f[x+1][j-1]-f[x][j-1]\le 1。
证毕。
有了这个性质又怎么样?得出结论:\Delta f 是一个 01 序列,所以可以用一个二进制数 S 压缩这个差分数组。
因此可以定义出 dp[i][S]:填 t 的前 i 位,\Delta f[1\sim n][i] 为 S 的方案数。最终 i 的答案就是 \sum dp[m][A],其中 A 是一个包含 i 个 1 的二进制数。
直接写包 TLE 的,需要预处理出 g[S][ch] 表示 S 的状态下一步填 ch 会怎么样。
例二:BZOJ3591:最长上升子序列
题意:给出 1\sim n 的一个排列的某一个最长上升子序列(记其长度为 m),求原排列可能的种类数。n\le 15。
在这道题目里,内层 DP 就是 "最长上升子序列"。
经过瞪眼法,我们发现 f[i] 表示前 i 个数的 LIS 长度没有好的性质。难道要放弃了吗?
转念想到 LIS 的另一种求法:维护 f_i 表示长度 i 的 LIS 结尾数最小值。而这个数组就有比较好的性质了:它是单调递增的,而且每新加一个数进来,只会修改一个位置。每个数有三种状态:在 f 中,曾经在 f 中,还没考虑。用三进制压缩为 S。
```
#include <bits/stdc++.h>
using namespace std;
const int N = 16;
int n, m;
int a[N], id[N];
int pw[N];
int dp[15000000];
//dp[S]:有多少种a[1~i]的安排方式,使a[1~i]的表格G恰好为S
//i为S中非0个数
//0是没放,1是在序列内,2是已经出了
int getdig(int S, int x) {
for (int i = 1; i <= x; i++)
S /= 3;
return S % 3;
}
int ans = 0;
vector<int> g[3];
int main() {
cin >> n >> m;
pw[0] = 1;
for (int i = 1; i <= n; i++)
pw[i] = pw[i - 1] * 3;
for (int i = 1; i <= m; i++) {
cin >> a[i];
a[i]--;
id[a[i]] = i - 1;
}
for (int i = 1; i < m; i++)
if (a[i] > a[i + 1]) {
puts("0");
return 0;
}
dp[0] = 1;
int val[20], LIS[20];
for (int S = 0; S < pw[n]; S++)
if (dp[S]) {
int st = S, cnt = 0, cur = 0;
for (int i = 0; i < n; i++) {
val[i] = getdig(S, i);
if (val[i])
cnt++;
if (val[i] == 1)
LIS[cur++] = i;
}
if (cnt == n) {
ans += dp[S];
continue;
}
for (int i = 0; i < n; i++) {
if (val[i])
continue;
if (id[i] && !val[a[id[i]]])
continue;
int pos = 0;
while (LIS[pos] < i && pos < cur)
pos++;
if (pos == m)
continue;
int SS = S + pw[i];
if (pos < cur)
SS += pw[LIS[pos]];
dp[SS] += dp[S];
}
}
printf("%d\n", ans);
return 0;
}
```
### 例三:[P8352:小 N 的独立集](https://www.luogu.com.cn/problem/P8352)
题意:给一棵树每个结点赋值 $1\sim k$ 的整数。求对于 $i=1\sim nk$,有多少种赋值方式使得这棵树的最大独立集答案为 $i$。对 $10^9+7$ 取模。$n\le 1000,k\le 5$。
DP 套 DP,第一步考虑最大独立集怎么求。$f[i][0/1]$ 表示 $i$ 的子树内 $i$ 强制选/不选的最大独立集。
于是考虑 $dp[i][A][B]$ 表示给 $i$ 的子树赋值,且使得 $f[i][0]=A,f[i][1]=B$ 的方案数。这是可以做的,复杂度为 $O(n^3k^4)$。
考虑优化。观察数据范围里的 $k\le 5$ 很有玄机。因为复杂度瓶颈就在于 $A,B$ 状态定义的复杂度太高了,启发我们用 $k\le 5$ 优化一下。而容易发现 $|A-\max(A,B)|\le k$,因为 $\max(A,B)$ 的方案若 $i$ 选了,把 $i$ 不选就可以得到一个 $A$ 的方案。
所以改为记录 $dp[i][A][\Delta]$ 表示 $i$ 的子树内 $f[i][0]=A$,$\max(f[i][0],f[i][1])-f[i][0]=\Delta$ 的方案数。复杂度降为 $O(n^2k^4)$。
```
#include <bits/stdc++.h>
using namespace std;
const int N = 1e3 + 5, MOD = 1e9 + 7;
int n, k;
vector<int> e[N];
int sz[N] = {};
int dp[N][N * 5][6]; //dp[i][j][k]:i子树内,f[i][0]=j,f[i][1]=k 的方案数
int tmp[N * 5][6];
void dfs(int x, int pr) {
sz[x] = 1;
for (int i = 1; i <= k; i++)
dp[x][0][i] = 1;
for (auto v: e[x]) {
if (v == pr)
continue;
dfs(v, x);
memset(tmp, 0, sizeof tmp);
for (int i = 0; i <= k * sz[x]; i++)
for (int j = 0; j <= k; j++) if (dp[x][i][j] != 0)
for (int p = 0; p <= k * sz[v]; p++)
for (int q = 0; q <= k; q++) if (dp[v][p][q] != 0) {
tmp[i + p + q][max(i + j + p, i + p + q) - (i + p + q)]
+= 1ll * dp[x][i][j] * dp[v][p][q] % MOD;
tmp[i + p + q][max(i + j + p, i + p + q) - (i + p + q)] %= MOD;
}
memcpy(dp[x], tmp, sizeof tmp);
sz[x] += sz[v];
}
}
int main() {
cin >> n >> k;
for (int i = 1, u, v; i < n; i++) {
cin >> u >> v;
e[u].push_back(v);
e[v].push_back(u);
}
dfs(1, 0);
for (int i = 1; i <= k * n; i++) {
int ans = 0;
for (int d = 0; d <= min(i, k); d++)
ans = (ans + dp[1][i - d][d]) % MOD;
cout << ans << endl;
}
return 0;
}
```
### 例四:[CF979E:Kuro and Topological Parity](https://codeforces.com/problemset/problem/979/E)
题意:初始有 $n$ 个点,可能为无色/白色/黑色三种情况。现将每个未染色点染色,并添加若干条有向边 $(u,v)$,要求 $u<v$。问有多少种方式使得黑白交替的路径条数 $\bmod 2=p$。$n\le 50$。
这题 $O(n^4)$ 可过,但是我们有 $O(n)$ 解法。
DP 套 DP,先考虑颜色定了,边定了怎么求黑白交替的路径条数。$f_i$ 表示以 $i$ 结尾的黑白交替路径条数。然后求 $\sum f_i$。注意到求的是 $\bmod 2$,所以只关注 $f_i$ 的奇偶性。
然后考虑外层,$dp[i][a][b][c]$ 表示考虑前 $i$ 个点,有 $a$ 个黑点以偶数条黑白交替路径结尾,$b$ 个黑点以奇数条黑白交替路径结尾,$c$ 个白点以偶数条黑白交替路径结尾(实际上就可以推出有 $i-a-b-c$ 个白点以奇数条黑白交替路径结尾)的方案数。
转移时枚举 $i+1$ 作为白奇、白偶、黑奇、黑偶四种情况。统计答案时枚举 $a,b,c$,满足 $(b+d)\bmod 2=p$ 即可。
这就是 $O(n^4)$ 的解法。下面是优化。
如果写出了转移方程,就能发现(简记 $dp[i][a][b][c]$ 为 $dp$):
1. $i+1$ 白奇,若 $b=0$,无法从 $dp$ 转移而来;否则增加 $dp\times 2^{i-1}$。
1. $i+1$ 白偶,若 $b=0$,增加 $dp\times 2^i$;否则增加 $dp\times 2^{i-1}$。
1. $i+1$ 黑奇,若 $d=0$,增加 $dp\times 2^i$;否则增加 $dp\times 2^{i-1}$。
1. $i+1$ 黑偶,若 $d=0$,无法从 $dp$ 转移而来;否则增加 $dp\times 2^{i-1}$。
因此只要记录 $dp[i][0/1][0/1][0/1]$,表示考虑前 $i$ 个点,$b$ 是否 $>0$,$d$ 是否 $>0$,当前黑白交替路径总数是奇数还是偶数 的方案数。
$O(n^4)$ 代码:
```
#include <bits/stdc++.h>
using namespace std;
typedef long long ll;
const int N = 55, MOD = 1e9 + 7;
int n, p;
int clr[N];
ll dp[N][N][N][N];
//dp[i][a][b][c]:a黑偶,b黑奇,c白偶
ll pw[N];
int main() {
cin >> n >> p;
for (int i = 1; i <= n; i++)
cin >> clr[i];
pw[0] = 1;
for (int i = 1; i <= 50; i++)
pw[i] = pw[i - 1] * 2 % MOD;
memset(dp, 0, sizeof dp);
dp[0][0][0][0] = 1;
for (int i = 0; i < n; i++)
for (int a = 0; a <= i; a++)
for (int b = 0; b <= i - a; b++)
for (int c = 0; c <= i - a - b; c++) {
int d = i - a - b - c;
//考虑i+1是什么颜色
if (clr[i + 1] != 1) { //i+1黑色
//i+1黑偶
if (d == 0)
;
else
dp[i + 1][a + 1][b][c] += dp[i][a][b][c] * pw[i - 1] % MOD;
//i+1黑奇
if (d == 0)
dp[i + 1][a][b + 1][c] += dp[i][a][b][c] * pw[i] % MOD;
else
dp[i + 1][a][b + 1][c] += dp[i][a][b][c] * pw[i - 1] % MOD;
}
if (clr[i + 1] != 0) { //i+1白色
//若i+1白偶
if (b == 0)
;
else
dp[i + 1][a][b][c + 1] += dp[i][a][b][c] * pw[i - 1] % MOD;
//若i+1白奇
if (b == 0)
dp[i + 1][a][b][c] += dp[i][a][b][c] * pw[i] % MOD;
else
dp[i + 1][a][b][c] += dp[i][a][b][c] * pw[i - 1] % MOD;
}
dp[i + 1][a + 1][b][c] %= MOD;
dp[i + 1][a][b + 1][c] %= MOD;
dp[i + 1][a][b][c + 1] %= MOD;
}
ll ans = 0;
for (int a = 0; a <= n; a++)
for (int b = 0; b <= n - a; b++)
for (int c = 0; c <= n - a - b; c++) {
int d = n - a - b - c;
if ((b + d) % 2 == p)
ans = (ans + dp[n][a][b][c]) % MOD;
}
cout << ans << endl;
return 0;
}
```