可持久化线段树 1（主席树）

Nemlit

2019-01-25 20:45:57

Solution

## [更多主席树内容可见原文](https://www.cnblogs.com/bcoier/p/10293521.html) PS：由于篇幅较长，只给出模板题代码，其他代码详见上述连接主席树，一个数据结构，能访问到历史版本的数据，常用于可持久化和区间k大值，是线段树的一个升级版。 ## 可持久化可持久化的意思是可以访问任意版本的数据，一眼想到的暴力做法就是开n个数组来记录，这显然是不可取的。那么我们考虑优化。若只有单点修改，不难发现每两个版本的差别最多为1，那么我们是不是可以只更改只一个数呢？ ~~显然是可以的。~~在线段树上，我们每访问到一个节点，如果该节点没有被修改，直接用指针指想该节点即可（和动态开点线段树类似）要注意的是，我们不能像以前一样用$k*2$表示左儿子，$k*2+1$表示右儿子了（如果你用动态开点就当我没说），而是要用指针来访问左右儿子。那我们怎么访问每一个版本呢？我们只需要对每一个版本存储一个根节点，从根节点访问就行了这样我们就可以很好的来处理可持久化的问题了。 ## [例题1-可持久化数组](https://www.luogu.org/problemnew/show/P3919) 直接采用上述方法，维护每一个版本的root即可有了可持久化数组，那么我们便可以操作其他可持久化数据结构，如可持久化并查集 ## [例题2-可持久化并查集](https://www.luogu.org/problemnew/show/P3402) 我们把每一个版本的fa数组记录下来，就可以很好的查询历史版本了。我们发现对于每次合并，fa数组只会修改一个（不能用路径压缩，因为路径压缩一次会修改很多值），所以我们直接用上述方法做就行了。如果直接修改，那么单次复杂度可能退化成O(n)，所以我们可以用启发式合并或按秩合并 ## 区间k大 ~~我们知道~~，[权值线段树](https://www.cnblogs.com/zmyzmy/p/9529234.html)是可以求全局k大的，那么我们可不可以用权值线段树来实现区间k大呢？ ~~显然是可以的。~~我们可以先考虑1~l区间的k大。我们给每一个点开一颗前缀的权值线段树，那么我们就可很容易的求出1~l的第k大值了。但是常规做法显然会炸空间，所以我们采用可持久化的方法来动态开点那么区间k大怎么做呢？这就要用到权值线段树的可减性。（权值线段树维护的是每个元素的出现个数，这显然是可减的）于是对于段区间，我们看成连段区间相减就行了。 ## [例题2-可持久化线段树](https://www.luogu.org/problemnew/show/P3834) 代码如下 ``` #include<bits/stdc++.h> using namespace std; #define re register #define il inline il int read() { re int x=0,f=1;re char c=getchar(); while(c<'0'||c>'9') {if(c=='-') f=-1;c=getchar();} while(c>='0'&&c<='9') x=x*10+c-48,c=getchar(); return x*f; } #define maxn 200005 struct node { int l,r,val; }e[maxn*20]; int n,m,root[maxn],cnt,b[maxn],a[maxn],co; il void build(int &k,int l,int r) { k=++cnt; if(l==r) return; int mid=(l+r)>>1; build(e[k].l,l,mid),build(e[k].r,mid+1,r); } il void change(int &k,int kk,int l,int r,int ll) { k=++cnt; e[k]=e[kk]; e[k].val++; if(l==r) return; int mid=(l+r)>>1; if(ll<=mid) change(e[k].l,e[kk].l,l,mid,ll); else change(e[k].r,e[kk].r,mid+1,r,ll); } il int query(int ll,int rr,int l,int r,int k) { int x=e[e[rr].l].val-e[e[ll].l].val; if(l==r) return b[l]; int mid=(l+r)>>1; if(x>=k) return query(e[ll].l,e[rr].l,l,mid,k); return query(e[ll].r,e[rr].r,mid+1,r,k-x); } int main() { n=read(),m=read(); for(re int i=1;i<=n;++i) a[i]=b[i]=read(); sort(b+1,b+n+1);//排序 co=unique(b+1,b+n+1)-b-1;//去重 build(root[0],1,co); for(re int i=1;i<=n;++i) { int now=lower_bound(b+1,b+co+1,a[i])-b;//意思是找到和a[i]相等的b，这样做的目的是保证所有的相等的全值都能保证被分到一个下标 change(root[i],root[i-1],1,co,now);//因为是前缀权值线段树，所以在前一刻子树的基础上修改 } while(m--) { int l=read(),r=read(),k=read(); printf("%d\n",query(root[l-1],root[r],1,co,k)); } return 0; } ``` ## [不那么模板的模板题](https://www.luogu.org/problemnew/show/P2633) 这题是强制在线，所以不能用整体二分等离线做法水过去，所以我们用主席树。拓展到了树上，所以我们可以进行dfs，把上一题的建树过程改成change(root[i],root[fa[i]],1,co,now)即可最后统计答案，我们不能直接用r的权值线段树-l的权值线段树，而使用l+r-lca(l,r)-fa[lca(l,r)]（这里表示权值线段树），正确性类似于树上差分，在此不再赘述。由于要求LCA，且要用dfs，所以我直接用树剖来求lca，将树剖的dfs1和要求的dfs合并在一起就行了。