题解 【P6580 [Ynoi2019] 美好的每一天~ 不连续的存在】
command_block
2021-07-01 07:11:00
**题意** : 给出一棵 $n$ 个节点的树,每个点有一个颜色,颜色为 $1$ 到 $c$ 的整数。再给出权值数组 $A_{1\sim c}$。
有 $m$ 次查询,每次查询树上只保留 $[l,r]$ 内的所有节点,设一个极大连通块中出现奇数次数的颜色个数为 $t$,则其对答案的贡献为 $A_t$ ,即答案是所有连通块贡献的和,询问间互相独立。
允许离线,$n,m\leq 10^5,c\leq 10^4$ ,时限 $\texttt{3s}$,空限$\texttt{64M}$。
------------
使用回滚莫队。
注意到权值数组是不规则的,只能采取较为暴力的做法。
- ## bitset!
每个点的复杂度权重为其度数,按权重将序列分块。
用 `bitset` 维护颜色出现次数 $\bmod~2$ 的结果。这样支持 $O(c/w)$ 合并两个联通块,并查询出现了奇数次的颜色数。
回滚莫队将问题转化为 $O(n\sqrt{m})$ 次联通块合并。复杂度 $O(n\sqrt{m}c/w)$ ,显然无法通过。
还有个问题, $n$ 个 bitset 的空间高达 $O(nc/w)$ ,也无法承受。
- ## 线段树合并!
我们发现,回滚莫队的右指针单调向右移动,此处发生的合并可以用线段树合并维护(还有并查集),于是一趟从左到右的合并被优化到了 $O(n\log c)$。
处理左指针时,可以沿用线段树合并,保留副本,$\rm xor$ 两次即可撤销贡献。
左指针的复杂度是暴力吗?
考虑“向集合 $[l+1,r]$ 中插入点 $l$ ”的复杂度,由于图是一棵树,这肯定小于“向 $[l+1,n]$ 中插入点 $l$ ”的复杂度。
于是,将 $l$ 的复杂度权重加上“向 $[l+1,n]$ 中插入点 $l$ 的复杂度”,不难发现,这个权重的总和等价于从后往前的一次合并,是 $O(n\log c)$ 的。
按照这个权重来分块,即可做到 $O(n\sqrt{m}\log c)$。
这个复杂度看起来很对劲,但由于线段树合并的常数较大,难以通过。
- ## 启发式合并!位运算魔改线段树!
把线段树合并换成启发式合并,复杂度同样是正确的。注意到按秩合并并查集也是启发式合并,这样实现会很方便。
但我们似乎并没有合适的数据结构。`std::set` 的启发式合并是 $O(\log^2)$ 的, $\text{Hash Table}$ 的理论复杂度正确,但常数实在太大。
注意到 $c$ 较小,可以设计一种特殊的基于位运算的数据结构 :
这个数据结构有三层,是一个树形结构。
底层是若干 `uint` ,用于保存颜色出现次数的奇偶性。
第二层每个节点分为 $32$ 叉,用一个 `uint` 记录每个分支中是否有值。
将二三层绑定在一起,不动态开点,这样第二层就不需要记录儿子指针,可以直接 $O(1)$ 调用任意一个儿子。
第一层分为 `10` 叉,同样用一个 `uint` 记录每个分支中是否有值。
不同于第二层的是,为了节省空间,此处需要记录儿子指针。
能够发现,单元素集合占用的空间是“一个第二层节点与其子树”,是 $32$ 个 `uint` 。而树根占用的空间是 $10$ 个指针。这样就可以卡进空间限制。
将集合 $S_1$ 合并到 $S_2$ 时,逐层考虑 :
- 对于第一层,若 $S_1$ 有某个分支且 $S_2$ 没有,则拷贝指针。
- 若两个第二层合并,容易用第二层上的 `uint` 找到所有需要操作的位置。
下面给出这个数据结构的实现 :
```cpp
const uint Bas=4294967295u;
struct BitBlo{
//第二层和第三层
int cnt;uint rt,buf[32];
void clear(){
while(rt){
int p=__builtin_ctz(rt);
rt^=(1u<<p);buf[p]=0;
}cnt=0;
}
void build(int x){
rt=(1u<<(x>>5));
buf[x>>5]=(1u<<(x&31));
cnt=1;
}
}T[MaxN];int tot;
void Sxor(BitBlo &A,const BitBlo &B)
{
//合并两个第二层节点
uint rt=A.rt&B.rt,rt2=(Bas^A.rt)&B.rt;
while(rt){
int p=__builtin_ctz(rt);rt^=(1u<<p);
A.cnt-=__builtin_popcount(A.buf[p]);
A.cnt+=__builtin_popcount(A.buf[p]^=B.buf[p]);
if (!A.buf[p])A.rt^=(1u<<p);
//在用 xor 代替撤回时,这个删除判断是必须的
}
while(rt2){
int p=__builtin_ctz(rt2);rt2^=(1u<<p);
A.cnt+=__builtin_popcount(A.buf[p]=B.buf[p]);
A.rt|=(1u<<p);
}
}
struct Bitset{
//第一层
uint rt;int t[10],cnt;
void clear(){
while(rt){
int p=__builtin_ctz(rt);
rt^=(1u<<p);t[p]=0;
}cnt=0;
}
inline void build(int x){
T[t[x>>10]=++tot].build(x&1023);
rt=(1u<<(x>>10));cnt=1;
}
}S[MaxN];
void Sxor(Bitset &A,const Bitset &B)
{
//合并两棵树
uint rt=A.rt&B.rt,rt2=(Bas^A.rt)&B.rt;
while(rt){
int p=__builtin_ctz(rt);rt^=(1u<<p);
if (A.t[p]==B.t[p]){
A.cnt-=T[A.t[p]].cnt;
A.t[p]=0;A.rt^=(1u<<p);
//这只会在用 xor 代替撤回时触发,将拷贝过去的指针撤回
}else {
A.cnt-=T[A.t[p]].cnt;
Sxor(T[A.t[p]],T[B.t[p]]);
A.cnt+=T[A.t[p]].cnt;
}
}
while(rt2){
int p=__builtin_ctz(rt2);rt2^=(1u<<p);
A.cnt+=T[A.t[p]=B.t[p]].cnt;
A.rt|=(1u<<p);
}
}
```
有点卡常,我卡了一个下午,后来晚高峰搭神机才过……
又优化了一下写法(去掉了原本的 `ull`),可以做到最大点 `2.35s` 。
根据 Ynoi 传统,不给出完整代码。