不错的树形 dp 练习题——树链剖分（非模板）

Sweetlemon

2019-12-18 19:55:42

Solution

$\Large{\text{可以得到比 std 更优的答案！值得一看！}}$ 既然能得到比 std 更优的答案（连样例都有更优的解），要不要加强数据？（雾）空说无凭，给出一组更优的样例输出（其实人力求解也可以得到这个更优解）。 ```plain 2 6 7 9 0 11 0 0 13 0 0 0 14 0 ``` 其实只是把 $4$ 的重儿子从 $8$ 改成了 $9$ 而已，原答案是 $18$，新答案是 $17$。（可能是为了降低难度才把 std 的解改劣？如果是这样，那就不要加强了吧~）（吹水完毕，题解正文开始） ### 树链剖分（非模板）这道题应该还是有不少部分分的方法的，比如随便选一个儿子输出（雾），或不管三七二十一直接重链剖分，都可以拿到一定的分数。下面介绍一种思路比较自然、实现不困难、可以得到比 std 更优的答案的树形 dp 方法。个人认为应该已经达到了理论最优解，欢迎 hack。 #### 条件转化题目中的“所有查询经过的轻重链的总数”不是特别容易统计，因此我们考虑把它进行转化。初始的一步是把 $x\rightarrow y$ 的路径拆成 $x\rightarrow \mathrm{LCA}(x,y),\ y\rightarrow \mathrm{LCA}(x,y)$ 两条树链，这一步应该很容易想到。这一次查询经过的链的总数就等于这两条树链包含的链的数量之和。（注：此处“树链”指的是树上一点到它的某个祖先的路径。）那么如何描述一条树链经过的链的数量呢？假设我们是暴力统计这个量，那么我们的思路可以是这样的：从 $x$ 一直跳到 $\mathrm{LCA}(x,y)$，考虑每一条边，如果这一条边和上一条边都是重边，那么这两条边在同一条重链上，不需要重复统计，答案不变；否则答案加 $1$。总结上面的过程，“一条树链经过的链的数量”可以描述为“树链的长度减去树链中相邻重边对的数量”，也就是假设这条树链的边依次是 $e_1,e_2,\cdots,e_k$，那么答案就应该是 $k-\sum_{i=1}^{k-1}[e_i,e_{i+1}\text{都是重边}]$。（注：$[\text{条件}]$ 表示条件成立时这个数是 $1$，否则是 $0$。）由于树链中边的数量是定值，所以想要让“所有查询经过的轻重链的总数”最小，就应该让“所有查询的树链所经过的相邻重边对”最多。这样我们就有了比较方便的统计量。方便在哪里呢？原来的“经过轻重链”所涉及的状态比较复杂，相比之下“相邻重边对”就简单多了——这个状态只与“这一条边”和“上一条边”有关。 #### 状态和状态转移的设计这道题是要决策“选哪个重儿子”，又有了比较容易表示的统计量，我们觉得可以试试树形 dp。按照树形 dp 的套路，我们只考虑某一棵子树。为方便叙述，先定义两个概念。相邻重边对需要有一个“统计位置”。这里我们把树链上相邻两条边上深度最大的点称为这个相邻边对的“基点”，并把基点作为相邻重边对的统计位置。换句话说，相邻边对就是基点往上跳两层。可以设 $w[y]$ 表示所有查询路径中，以 $y$ 为基点的相邻边对的出现次数。选择基点进行统计的理由是，每个基点唯一对应一条相邻边对。另外，我们称基点的父亲为“中点”，中点是相邻边对的两条边的公共点。我们设 $f'[x]$，表示在所有划分 $x$ 子树的轻重儿子的方案中，中点在 $x$ 子树中（中点在 $x$ 子树中，也就意味着基点一定是 $x$ 的子孙）的有效相邻重边对的最大数量。这里的有效指的是出现在查询路径中，而且“数量”指的是出现在查询路径中的总次数。$f'[1]$ 达到最优时，我们也就得到了这道题的最优解。那么我们考虑这个状态如何转移呢？假设我们已经算出了 $x$ 的所有子节点的 $f'$，那么 $f'[x]$ 比儿子多出的那一部分，就是以 $x$ 为中点（也就是以 $x$ 的儿子为基点）的相邻重边对，而这就涉及到“$x$ 是不是重儿子”的问题；但在我们的状态中，没有办法处理“$x$ 是不是重儿子”！怎么办呢？加上去不就好了？设 $f[x][0/1]$ 表示在 $x$ 不是（$0$）/ 是（$1$）重儿子的情况下，在所有划分 $x$ 子树的轻重儿子的方案中，中点在 $x$ 子树中的有效相邻重边对的最大数量。当 $f[1][0]$ 取到最优解的时候，就得到本题的答案。现在似乎就比较容易转移了。如果 $x$ 不是重儿子，那么不能产生以 $x$ 为中点的相邻重边对，此时只需要在 $x$ 的儿子中选出重儿子。$f[x][0]=\max\limits_{y\in \mathrm{children}[x]}(f[y][1]+\sum\limits_{u\in \mathrm{children}[x],u\neq y}f[u][0])$。式中的 $y$ 是枚举的重儿子。如果 $x$ 是重儿子，那么会产生以 $x$ 为中点的相邻重边对。假如 $y$ 是 $x$ 的重儿子，那么相邻边对 $y\rightarrow x\rightarrow \mathrm{par}(x)$ 就成为了相邻重边对。回忆一下，我们设 $w[y]$ 表示所有查询路径中，以 $y$ 为基点的相邻边对的出现次数；那么新产生的相邻重边对的个数就是 $w[y]$。$f[x][1]=\max\limits_{y\in \mathrm{children}[x]}(f[y][1]+w[y]+\sum\limits_{u\in \mathrm{children}[x],u\neq y}f[u][0])$。这个树形 dp 的主框架已经完成了。我们只需要在计算 $f$ 的过程中，记录好“决策点”，也就是使 $f[x][0],f[x][1]$ 取最大值的 $y$ 分别是多少，最后输出答案时根据 $x$ 最后是不是重儿子输出相应的决策点即可。现在的问题是，如何计算 $w[y]$ 呢？ #### 预处理工作查询一条路径 $x\rightarrow y$ 的时候，假设这条路径是 $x\rightarrow u\rightarrow \mathrm{LCA}(x,y) \rightarrow v \rightarrow y$，其中 $u,v$ 都是 $\mathrm{LCA}$ 的直接儿子，那么从 $x$ 到 $u$、从 $y$ 到 $v$ 的点（不含 $u,v$）的 $w$ 都要加 $1$（回忆一下，基点“往上跳两次”的次数是 $w$）。怎么实现这个加 $1$ 呢？我们可以用 ~~树链剖分+线段树~~ ~~树链剖分+树状数组~~ 树上差分（因为是全部加完再查询，相当于离线操作，因此差分就够了）。设 $\mathrm{delt}[x]$ 表示 $x$ 对 $x$ 和 $x$ 的祖先的 $w$ 的贡献；也就是 $\mathrm{delt}[x]$ 加 $1$，就相当于给 $x$ 和 $x$ 的祖先的 $w$ 都加了 $1$。那么处理每个查询时，只需 `delt[x]++,delt[y]++,delt[u]--,delt[v]--`；最后令 $w[x]$ 为以 $x$ 为根的子树的 $\mathrm{delt}$ 之和即可（因为只有子孙才对 $x$ 有贡献，而子孙的 $\mathrm{delt}$ 之和便是它们对 $x$ 的总贡献）。还有一个小问题，如何求出 $u,v$ 呢？我们选择用倍增 LCA，在倍增的过程中很容易得到 $u,v$。另外，如果 $x$ 或 $y$ 本身就是 $\mathrm{LCA}$ 呢？或者 $x,y$ 本身就是 $\mathrm{LCA}$ 的直接儿子呢？这些问题都不大，我们只要令 `u=x` 或 `v=y`，一加一减就抵消了。写代码的时候注意处理。 #### 思路总结综上，这题的主要解决步骤是： 1. 读入树，做好 LCA 的预处理，$O(n \log n)$ 2. 读入查询，用倍增 LCA 找 $u,v$，做树上差分，$O(q \log n)$ 3. dfs 一遍，由差分得到 $w$，$O(n)$ 4. 进行树上 dp，求出 $f$ 的决策点，$O(n)$ 5. 根据决策情况确定重儿子，输出答案，$O(n)$ 总复杂度是 $O(n\log n)$ 级别的，瓶颈是 LCA。这道题的主要启示就是，拿到题要勤于转化题目的条件，把不好处理的条件转化为熟悉的、容易处理的条件，这样就比较容易解题了。 #### 代码代码比较长，但是基本都是套路，因此也不难写。吐槽一下数据太弱，把我一份连样例都没过的错误代码（那份代码的 LCA 写炸了）放过去了。建议把样例加入数据中（笑）。评测记录在[这里](https://www.luogu.com.cn/record/28552121)。可以看到答案基本上都比 std 优。 ```cpp #include <cstdio> #include <cctype> #include <algorithm> #define MAXIOLG 25 #define FILENAME(x)\ freopen(x".in","r",stdin);\ freopen(x".out","w",stdout); #define LOWBIT(x) ((x)&(-(x))) #define MAXN 100005 #define MAXM 200005 #define MAXLG 17 using namespace std; typedef long double ld; typedef long long ll; typedef ll io_t; //快读快写 io_t shin[MAXIOLG]; io_t seto(void); void ayano(io_t x,char spliter='\n'); int n; //存图 int g[MAXM]; int fst[MAXN],nxt[MAXM],edges=0; //倍增父亲数组, 儿子数量, 深度 int par[MAXLG][MAXN],chs[MAXN],depth[MAXN]; //log 2 的值的预处理 int lg[MAXN]; //差分数组，后来直接用来表示 w int delt[MAXN]; //f 数组和决策点数组 int f[MAXN][2],h[MAXN][2]; //isp=is preferred，是不是重儿子；pr[x] 表示 x 的重儿子 int isp[MAXN],pr[MAXN]; void dfs1(int x,int pa); //预处理 LCA int jmp(int x,int k); //x 往上跳 k 层 void solve(int x,int y); //处理查询 void dfs2(int x,int pa); //树上差分的求和, delt 变成 w void dfs3(int x,int pa); //树上 dp void dfs4(int x,int pa); //由决策点得出答案 void addedge(int u,int v); //加边 int main(void){ n=seto(); int q=seto(); { //预处理 log 2 lg[0]=lg[1]=0; int tlg=0; for (int i=2;i<=n;i++) (i==LOWBIT(i))?(tlg++):(0),lg[i]=tlg; } for (int i=1;i<n;i++){ int u,v; u=seto(),v=seto(); addedge(u,v),addedge(v,u); } //预处理 LCA dfs1(1,0); for (int tlg=1,lgn=lg[n];tlg<=lgn;tlg++){ int ulg=tlg-1; for (int i=1;i<=n;i++) par[tlg][i]=par[ulg][par[ulg][i]]; } //处理查询 while (q--){ int u,v; u=seto(),v=seto(); solve(u,v); } //树上差分的求和, delt 变成 w dfs2(1,0); //树上 dp dfs3(1,0); //由决策点得出答案 isp[1]=0; //1 不是重儿子 dfs4(1,0); //输出答案 for (int i=1;i<=n;i++) ayano(pr[i]); return 0; } void dfs1(int x,int pa){ //预处理 LCA par[0][x]=pa,depth[x]=depth[pa]+1; for (int ei=fst[x];ei;ei=nxt[ei]){ int v=g[ei]; if (v==pa) continue; dfs1(v,x),chs[x]++; } } void dfs2(int x,int pa){ //树上差分的求和, delt 变成 w for (int ei=fst[x];ei;ei=nxt[ei]){ int v=g[ei]; if (v==pa) continue; dfs2(v,x); delt[x]+=delt[v]; } } void dfs3(int x,int pa){ //树上 dp if (!chs[x]){ //叶子节点的 f 和决策点都是 0 f[x][0]=f[x][1]=h[x][0]=h[x][1]=0; return; } int s0=0; //所有儿子 u 的 f[u][0] 之和 for (int ei=fst[x];ei;ei=nxt[ei]){ int v=g[ei]; if (v==pa) continue; dfs3(v,x); s0+=f[v][0]; } int f0=-1,f1=-1; //当前最优 f[x][0], f[x][1] int h0=0,h1=0; //当前决策点 for (int ei=fst[x];ei;ei=nxt[ei]){ int v=g[ei]; if (v==pa) continue; int tf0=s0-f[v][0]+f[v][1]; int tf1=tf0+delt[v]; (tf0>f0)?(f0=tf0,h0=v):(0); (tf1>f1)?(f1=tf1,h1=v):(0); } f[x][0]=f0,f[x][1]=f1; h[x][0]=h0,h[x][1]=h1; } void dfs4(int x,int pa){ //由决策点得出答案 pr[x]=h[x][isp[x]]; //根据 x 是不是重儿子，选择相应决策点 (pr[x])?(isp[pr[x]]=1):(0); for (int ei=fst[x];ei;ei=nxt[ei]){ int v=g[ei]; if (v==pa) continue; dfs4(v,x); } } inline int jmp(int x,int k){ //x 往上跳 k 层 if (!k) return x; for (int i=0,lgk=lg[k];i<=lgk;i++){ int tpw=1<<i; (k&tpw)?(x=par[i][x]):(0); } return x; } void solve(int x,int y){ //处理 x y 查询 if (x==y || par[0][x]==y || par[0][y]==x) //特殊情况判断 return; delt[x]++,delt[y]++; int xd=depth[x],yd=depth[y],dd; if (xd<yd) swap(x,y),dd=yd-xd; else dd=xd-yd; int txans=x,tyans=y; //txans, tyans 表示 u, v int xjmp=jmp(x,dd); if (xjmp==y){ //LCA 就是 y txans=jmp(x,dd-1); tyans=y; } else { x=xjmp; for (int tlg=lg[depth[x]];~tlg;tlg--) (par[tlg][x]!=par[tlg][y])?(x=par[tlg][x],y=par[tlg][y]):(0); txans=x,tyans=y; } delt[txans]--,delt[tyans]--; } void addedge(int u,int v){ //加边 edges++; g[edges]=v; nxt[edges]=fst[u],fst[u]=edges; } io_t seto(void){ //快读 io_t ans=0; int symbol=0; char ch=getchar(); while (!isdigit(ch)) (ch=='-')?(symbol=1):(0),ch=getchar(); while (isdigit(ch)) (ans=ans*10+(ch-'0')),ch=getchar(); return (symbol)?(-ans):(ans); } void ayano(io_t x,char spliter){ //快写 if (!x){ putchar('0'),putchar(spliter); return; } if (x<0) putchar('-'),x=-x; int len=0; while (x){ io_t d=x/10; shin[len++]=x-d*10; x=d; } while (len){ len--; putchar(shin[len]+'0'); } putchar(spliter); } ```