题解 P4218 【[CTSC2010]珠宝商】

WAPER4EVER

2020-05-27 21:56:02

Solution

### 一丶前言: 这道题真的好巧啊,是一道很好的训练后缀自动机与点分治 ~~(与让自己自闭)~~ 的题 ### 二丶思路: 假设匹配串为$S$ ~~显然,对匹配串$S$建后缀自动机~~ 然后有一个十分简单的暴力思路,我们枚举树上的起始点$x$,然后从$x$开始直接dfs,在dfs的同时在SAM的DAG上跑匹配(如果找不到转移直接return)就好了。 假设到了后缀自动机的$y$号节点,$ans+=size[y]$就好了($size$是SAM点上的$right$集合大小) 对于学过后缀自动机 ~~(如果你没学过来做这道题干嘛)~~ 的各位来说,相信还是十分简单的,时间复杂度$O(n^2)$ 接着,我们开始考虑正解。 看到我们要处理树上的所有路径,我们不由自主地会想到点分治。假设当前分治中心是$x$,我们该怎么处理? 直接算$\sum_{a} \sum_{b}[a$ 到 $x$组成的字符串在$S$出现的次数$]\times[x$到$b$组成的字符串在$S$出现的次数$]$ ? 这样显然不对,因为我们不能说前面出现在$S$,后面也出现在$S$,它们拼起来就一定出现在$S$ 换句话说,它们在$S$中出现的位置不一定相同 **再换句话说,我们要求的是:** $\sum_{p}\sum_{a}\sum_{b} [a$ 到 $x$组成的字符串出现在$S$且末尾为$p] \times [x$到$b$组成的字符串出现在$S$且起点是$p]$ (请看清楚上面那个和式qwq) 那我们只用枚举$p$,然后统计有多少个$a,b$满足$[a$到$x$组成的字符串出现在$S$且末尾为$p]$与$[x$到$b$组成的字符串出现在$S$且起点是$p]$就行了 显然两个统计是对称的(把$S$倒过来后者就变成了前者),所以我们只用考虑对第一种情况进行统计。 为了方便,下面假设$T$为是$a$到$x$形成的字符串,$pos[p]$为$S[1,p]$在SAM对应的节点 如果一个$T$是合法的,那么应该满足: $\quad$1.$T$出现在$S$中 $\quad$2.$T$在SAM上对应的点的$right$集合包含$p$(既然它出现在$S$中那它肯定能对应SAM上一个点) 那我们只需要整一个$num$数组,并在$dfs$中途随时在找出$T$在SAM上的对应的节点$v$,并$num[v]++$就好了(如果没有直接return就好了) 问题就来了,如果我是在往$T$后面加字符,我直接在SAM的DAG上转移就好了,问题在于现在我是在往$T$前面加字符,我该怎么转移呢? 这个东西涉及到$Parent Tree$求儿子的问题,我们接下来再讲(当然你如果会了可以略过) 现在假设我们已经知道了在$T$前面加字符是如何转移的,并统计出了$num$数组,然后我们怎么求答案呢? 直接枚举$pos[p]$的所有祖先的$num$加起来?显然TLE 其实只要至上而下$num[x]+=num[fa[x]]$,然后$num[pos[p]]$就是答案了 现在我们回到上面的那个问题,我们往$T$前面加字符在SAM对应的点的变化情况。假设现在$T$对应SAM上的点$v$,并在$T$的前面加一个字符$c$,分两种情况讨论(假设$R[v]$表示$v$节点的任意一个$right$): 1. $|T|<len[v]$,直接看接判断$[c==S[R[v]-|T|]]$,若为真$T$仍然对应$v$,否则$T$将不再出现在$S$中 2. $|T|==len[v]$,看有没有一个点$x$满足$fa[x]=v$,且$S[R[x]-len[v]]==c$,若有则$T$对应$x$,否则$T$将不再出现在$S$中 这样关于$ParentTree$的儿子的定义也呼之欲出了: $son[x][p]$表示在$p+S[R[x]-len[x]+1,R[x]]$在$S$中对应的节点(这个数组可以在build时求出) 那么上面的第二条也可以改写成: 若$son[v][c]$存在,则$T$对应$son[v][c]$,否则$T$将不再出现在$S$中 时间复杂度为$O(nlogn+nm)$ 等等,我们整了那么久,搞出来那么多东西,复杂度还变劣了??~~(不做了下一道)~~ 我们研究一下这个算法缺点在哪儿?其实缺点就在于,不管我们现在处理的分治子树多么的小,我们都需要把整个$m$遍历一遍,这样是很不划算的。 那咋办呢?等等,我们是不是还有一个$O(n^2)$的做法,那我们对小的分治子树直接进行$O(n^2)$的做法不就好了 自然考虑分块,对于小于等于$sqrt(n)$的分治子树直接暴力$n^2$,而对大的分治子树进行~~刚刚我们神奇的操作~~ 还有个小问题 **(几乎是所有点分治都记得要考虑的问题)**,$a$和$b$可能来自同一个子树,其实也很简单,直接容斥减掉就好了。 相信你现在几乎是一定一脸懵逼的 ~~(如果不是那说明你太强了%%%)~~,所以我们接下来结合代码理解一下吧。 ### 三丶代码 ```cpp //BadWaper gg #include<bits/stdc++.h> #define inf 1e9 #define eps 1e-6 #define N 100010 using namespace std; typedef long long ll; typedef unsigned long long ull; inline ll read() { char ch=getchar(); ll s=0,w=1; while(ch<'0'||ch>'9'){if(ch=='-')w=-1;ch=getchar();} while(ch>='0'&&ch<='9'){s=s*10+ch-'0';ch=getchar();} return s*w; } ll n,m; struct edge { ll next,to; }e[N<<1]; ll head[N],cnt,vis[N]; ll pos1[N],pos2[N]; ll a[N],s[N]; char s1[N],s2[N]; ll size[N],C[N],p[N],ans; ll minn=inf,rt,block; struct SAM { ll len[N],ch[N][26],fa[N]; ll tot,son[N][26],R[N],size[N],num[N],last; ll p[N],c[N]; ll s[N]; SAM(){tot=last=1;} inline void insert(ll x) { ll nowp=++tot,p=last;len[nowp]=len[p]+1;size[nowp]=1;R[nowp]=len[nowp]; while(p&&!ch[p][x])ch[p][x]=nowp,p=fa[p]; if(!p)fa[nowp]=1; else { ll q=ch[p][x]; if(len[q]==len[p]+1)fa[nowp]=q; else { ll nowq=++tot;len[nowq]=len[p]+1; fa[nowq]=fa[q];fa[q]=nowq,fa[nowp]=nowq; for(register ll i=0;i<26;i++)ch[nowq][i]=ch[q][i]; while(p&&ch[p][x]==q)ch[p][x]=nowq,p=fa[p]; } } last=nowp; }//建SAM inline void build() { for(register ll i=1;i<=tot;i++)c[len[i]]++; for(register ll i=1;i<=m;i++)c[i]+=c[i-1]; for(register ll i=1;i<=tot;i++)p[c[len[i]]--]=i;//基排 for(register ll i=tot;i>=2;i--) { ll x=p[i]; size[fa[x]]+=size[x];R[fa[x]]=R[x];//R是right集合内任意一个值,所以这里你爱咋搞咋搞啦qwq son[fa[x]][s[R[x]-len[fa[x]]]]=x;//求son } } inline void clear(){for(register ll i=1;i<=tot;i++)num[i]=0;} inline void calc(ll now,ll father,ll p,ll L) { if(len[p]==L)p=son[p][a[now]];//情况2 else if(s[R[p]-L]!=a[now])p=0;//情况1 if(!p)return ;//T不在S直接return num[p]++; for(register ll i=head[now];i;i=e[i].next) { if(e[i].to==father||vis[e[i].to])continue; calc(e[i].to,now,p,L+1); } } inline void pushdown() { for(register ll i=2;i<=tot;i++)//自上而下 { ll x=p[i]; num[x]+=num[fa[x]]; } } }S1,S2; inline void add_edge(ll from,ll to){e[++cnt]=(edge){head[from],to};head[from]=cnt;} void getroot(ll now,ll Ns,ll father) { size[now]=1;ll maxn=-inf; for(register ll i=head[now];i;i=e[i].next) { if(e[i].to==father||vis[e[i].to])continue; getroot(e[i].to,Ns,now);size[now]+=size[e[i].to]; maxn=max(maxn,size[e[i].to]); } maxn=max(maxn,Ns-size[now]); if(maxn<minn)minn=maxn,rt=now; }//点分治求根 void dfs1(ll now,ll father) { p[++p[0]]=now; for(register ll i=head[now];i;i=e[i].next) { if(e[i].to==father||vis[e[i].to])continue; dfs1(e[i].to,now); } }//n^2暴力 void dfs2(ll now,ll father,ll x) { x=S1.ch[x][a[now]];if(!x)return ; ans+=S1.size[x]; for(register ll i=head[now];i;i=e[i].next) { if(e[i].to==father||vis[e[i].to])continue; dfs2(e[i].to,now,x); } }//n^2暴力 void calc(ll x,ll father,ll f) { S1.clear(),S2.clear(); if(father) { S1.calc(x,0,S1.son[1][a[father]],1); S2.calc(x,0,S2.son[1][a[father]],1); } else {S1.calc(x,0,1,0);S2.calc(x,0,1,0);} S1.pushdown();S2.pushdown(); for(register ll i=1;i<=m;i++) { ans+=f*S1.num[pos1[i]]*S2.num[pos2[m-i+1]]; }//统计答案,注意因为串反过来了所以后面是m-i+1 } void DFS(ll now,ll father) { C[now]=1; for(register ll i=head[now];i;i=e[i].next) { if(e[i].to==father||vis[e[i].to])continue; DFS(e[i].to,now);C[now]+=C[e[i].to]; } }//求分治子树大小 void dfs(ll now,ll Ns) { if(Ns<=block) { p[0]=0;dfs1(now,0); for(register ll i=1;i<=p[0];i++)dfs2(p[i],0,1); return ; }//n^2暴力 vis[now]=1;calc(now,0,1);DFS(now,0); for(register ll i=head[now];i;i=e[i].next) { if(vis[e[i].to])continue; calc(e[i].to,now,-1);//容斥,把同一子树的答案容斥掉 minn=inf,rt=0; getroot(e[i].to,C[e[i].to],0);dfs(rt,C[e[i].to]); } } int main() { //freopen(".in","r",stdin); //freopen(".out","w",stdout); n=read(),m=read();block=sqrt(n); for(register ll i=1;i<n;i++) { ll x=read(),y=read(); add_edge(x,y);add_edge(y,x); } scanf("%s",s1+1); for(register ll i=1;i<=n;i++)a[i]=s1[i]-'a'; scanf("%s",s2+1); for(register ll i=1;i<=m;i++)s[i]=s2[i]-'a'; for(register ll i=1;i<=m;i++)S1.insert(s[i]),pos1[i]=S1.last,S1.s[i]=s[i]; reverse(s+1,s+m+1);//把串翻转之后第二个统计与第一个统计类似 for(register ll i=1;i<=m;i++)S2.insert(s[i]),pos2[i]=S2.last,S2.s[i]=s[i]; S1.build();S2.build(); getroot(1,n,0);dfs(rt,n); printf("%lld\n",ans); return 0; } ``` ### 四丶后记 我们做一道题不仅仅是要搞懂这道题怎么做,更要学会从这道题上反思与总结。 在平时的SAM学习中,我们几乎只用过在字符串后加字符(跑DAG),或者是在字符串前删字符(跳ParentTree),但这道题特殊之处就在于我们是在字符串前加入字符,并由此定义出了ParentTree上儿子的定义。(如果是在字符串后面删字符该怎么做呢qwq) 这是我从这道题收获到的东西,当然每个人收获到的东西多半都不一样,希望你也能从我的题解和这道题上有一定收获。 **如果你觉得这篇题解对你有帮助,那你可以点个赞支持我一下qwq。如果你对题解有任何问题/认为我的题解有任何问题,可以私信/在评论区发出来,当然如果你对我的题解有任何意见/建议也欢迎指出。我会尽我全力把我题解写到最好的qwq** ~~这篇题解大部分我认为人人皆知的东西我就没定义了,往谅解qwq~~