题解 P4462 【[CQOI2018]异或序列】
闲话
-
博主更新给管理员带来的不便请谅解
-
UPD 20200207 - 添加了一些归纳过的计算公式
-
UPD 20200210 - 更正了将块取小的原因。
这是一篇 在线算法 的题解!!!
用了分块,虽然比莫队差一点点点点,但怎么说也是一种优美的解法。
只是比较考验细节,调了好几个小时啊啊啊啊啊。。。
wtcl...
正片
数列分块的思想(熟悉的可以略过)
数列分块又被称作数列的平方分割。
数列分块是将整段数列分为均匀的几块,使得每块长度为
然后对每个块都维护一些必要的信息。
比如:P3372 【模板】线段树 1这一题就可以用分块做。
我们维护一下每个块的原数字之和,加法标记即可。
查询或修改时,并不一定目标区间一定包含整块。对于边角块,暴力。对于整块,取其现成维护的信息即可。
由于散块中的元素不超过
如果仅仅对分块了解至此,对于本题而言还是远远不够的。详细的教程请自行到网上学习。这里不再赘述。
本题中,这里认为
下面算法基于的技巧
在下面的算法中,我们要做到快速求得某一段的异或和。
我们知道,异或的逆运算即为异或。
所以我们定义
那么
现在问题成了:给定
注意,由于实际使用时,
对于此题需要维护的信息
我们现在使用
至于为什么做这些,请继续阅读。
这里我们暂时仍用
预处理——pre,ans 的求法。
先是
下面的代码优化了一下,就是先求出最大的
memset(pre[0],0,sizeof(pre[0]));
limits=*max_element(s,s+1+n);
for(register int i=0,j=0;i<=n;i++)
{
if(i%B==0)
{
block=++j;
for(register int val=0;val<=limits;val++)
pre[j][val]=pre[j-1][val];
}
belong[i]=j,pre[j][s[i]]++;
}
这部分的复杂度为
然后是
- 计算
ans[i][i] :
这个不难,只要暴力计算就行了。复杂度
- 计算
ans[i][j](j>i)
上面我们计算的
我们假设我们已经求得了
Wrong!
上面,我们相当于只计算了区间的左右端点(这里左右端点指“下面算法基于的技巧”中的
那怎么计算呢?我们可以枚举上述2部分的其中一部分的所有元素,另一部分可以利用已经求得的
那么枚举那一部分呢?显然是第二部分。因为第二部分是一个块,最多
处理
for(register int i=1;i<=block;i++)
for(register int j=(i-1)*B;j<=min(n,i*B-1);j++)
for(register int p=j+1;p<=min(n,i*B-1);p++)
if((s[j]^s[p])==k) ans[i][i]++;
for(register int i=1;i<=block;i++)
for(register int j=i+1;j<=block;j++)
{
ans[i][j]=ans[i][j-1]+ans[j][j];
for(register int p=(j-1)*B;p<=min(n,j*B-1);p++)
ans[i][j]+=pre[j-1][s[p]^k]-pre[i-1][s[p]^k];
}
预处理工作就这么愉快的结束啦!预处理总复杂度为
在查询时利用好预处理的信息
查询时,输入是
那么查询怎么做呢?别急,我们暂且讨论一下如何在
定义
快速计算散块
我们先扫一边区间,并处理好
代码:
LL ret=0ll;
for(register int i=l;i<=r;i++)
__rec[s[i]]++;
for(register int i=l;i<=r;i++)
__rec[s[i]]--,ret+=__rec[s[i]^k];
return ret;
对于散块,或者
由于这两种情况扫描的长度不超过
包含整块的情况
这是本题的第二个难点。
当时智障的我:这不就散块暴力,中间直接取
Wrong!
还是那个问题:我们不能保证左右端点都在(这里左右端点指“下面算法基于的技巧”中的
所以麻烦的来了:我们不仅要计算三个独立的块,还有以下三种情况:
-
左端点在左散块,右端点在整块
-
左端点在左散块,右端点在右散块
-
左端点在整块,右端点在右散块
不急,慢慢来。
以下使用
X 表示整块的第一块,用Y 表示整块的最后一块。
- 三个独立的部分:
左右散块像上面一样暴力,整块部分直接取
- 左端点在左散块,右端点在整块
我们枚举左散块的所有元素,枚举至
- 左端点在左散块,右端点在右散块
先扫一遍左散块的所有元素,记录好左散块中每个元素出现的次数,即
然后枚举右散块的所有元素,枚举至
- 左端点在整块,右端点在右散块
整块不好枚举,所以我们枚举右端点。其他的操作与情况2的处理方式基本相同。
以上就是处理包含整块情况的查询的全部内容啦!
代码:
int X=belong[l]+1,Y=belong[r]-1;
LL ret=0ll;
/*整块*/
ret+=ans[X][Y];
/*左散块*/
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]++;
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]--,ret+=__rec[s[i]^k];
/*右散块*/
for(register int i=r;belong[r]==belong[i];i--)
__rec[s[i]]++;
for(register int i=r;belong[r]==belong[i];i--)
__rec[s[i]]--,ret+=__rec[s[i]^k];
/*左散块 -> 右散块*/
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]++;
for(register int i=r;belong[r]==belong[i];i--)
ret+=__rec[s[i]^k];
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]--;
/*左散块 -> 整块*/
for(register int i=l;belong[l]==belong[i];i++)
ret+=pre[Y][s[i]^k]-pre[X-1][s[i]^k];
/*整块 -> 右散块*/
for(register int i=r;belong[r]==belong[i];i--)
ret+=pre[Y][s[i]^k]-pre[X-1][s[i]^k];
return ret;
复杂度:还是取决于散块的最大长度,为
时空复杂度
再次注明:此处认为
时间:
空间:
完整代码
#include<cstdio>
#include<cstring>
#include<algorithm>
using namespace std;
inline int read(){int x=0,f=1;char c=getchar();while(c<'0'||c>'9'){if(c=='-')f=-1;c=getchar();}while(c>='0'&&c<='9'){x=x*10+c-'0';c=getchar();}return f*x;}
const int N=1e5+5;
const int K=1e5+5;
const int B=150;
const int T=N/B+5;
int s[N];
int n,m;
int k;
namespace SqrtDiv
{
typedef long long LL;
int belong[N];
int pre[T][K<<1];
LL ans[T][T];
int limits;
int block;
inline void init()
{
memset(ans,0,sizeof(ans));
memset(pre[0],0,sizeof(pre[0]));
limits=*max_element(s,s+1+n);
for(register int i=0,j=0;i<=n;i++)
{
if(i%B==0)
{
block=++j;
for(register int val=0;val<=limits;val++)
pre[j][val]=pre[j-1][val];
}
belong[i]=j,pre[j][s[i]]++;
}
for(register int i=1;i<=block;i++)
for(register int j=(i-1)*B;j<=min(n,i*B-1);j++)
for(register int p=j+1;p<=min(n,i*B-1);p++)
if((s[j]^s[p])==k) ans[i][i]++;
for(register int i=1;i<=block;i++)
for(register int j=i+1;j<=block;j++)
{
ans[i][j]=ans[i][j-1]+ans[j][j];
for(register int p=(j-1)*B;p<=min(n,j*B-1);p++)
ans[i][j]+=pre[j-1][s[p]^k]-pre[i-1][s[p]^k];
}
}
int __rec[K<<1];
inline LL query(int l,int r)
{
LL ret=0ll;
if(belong[r]-belong[l]<=1)
{
for(register int i=l;i<=r;i++)
__rec[s[i]]++;
for(register int i=l;i<=r;i++)
__rec[s[i]]--,ret+=__rec[s[i]^k];
return ret;
}
int X=belong[l]+1,Y=belong[r]-1;
/*整块*/
ret+=ans[X][Y];
/*左散块*/
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]++;
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]--,ret+=__rec[s[i]^k];
/*右散块*/
for(register int i=r;belong[r]==belong[i];i--)
__rec[s[i]]++;
for(register int i=r;belong[r]==belong[i];i--)
__rec[s[i]]--,ret+=__rec[s[i]^k];
/*左散块 -> 右散块*/
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]++;
for(register int i=r;belong[r]==belong[i];i--)
ret+=__rec[s[i]^k];
for(register int i=l;belong[l]==belong[i];i++)
__rec[s[i]]--;
/*左散块 -> 整块*/
for(register int i=l;belong[l]==belong[i];i++)
ret+=pre[Y][s[i]^k]-pre[X-1][s[i]^k];
/*整块 -> 右散块*/
for(register int i=r;belong[r]==belong[i];i--)
ret+=pre[Y][s[i]^k]-pre[X-1][s[i]^k];
return ret;
}
}
signed main()
{
n=read(),m=read(),k=read();
for(register int a,i=1;i<=n;i++)
a=read(),s[i]=s[i-1]^a;
SqrtDiv::init();
while(m--)
{
int l=read()-1,r=read();
printf("%lld\n",SqrtDiv::query(l,r));
}
return 0;
}
注意事项
-
-
注意询问时要将
l 减一,预处理时从0开始。 -
虽然原数字中的元素不超过
10^5 ,但是\oplus 之后可能会超过这个值。10^5 的二进制是1 1000 0110 1010 0000,共17位,值域应该开到2^{18} ,也就是1<<18。这里直接开到了2\times 10^5 。 -
注意暴力计算散块时,
rec[s_i] 要先减去一再加入答案。最后清空rec 时不能草率地memset,因为这样时O(n) 的复杂度会原地爆炸。应当怎么加过来,怎么减回去,具体操作上面的代码有所体现。
未考虑到的问题
块的大小,真的最好是\sqrt{n} 吗?
有人已经发现了:上面代码中块的大小我调小了。
如果把块的大小设成
这是咋回事呀??
观察以下我们的算法,会发现预处理做的干净利落,但询问有一坨循环,虽说复杂度正确,但常数还是有点大。减少询问时间的方式就是减小块长。(效率只与块长有关的说法并不正确,因为预处理的第一步就是
因此我调小了块的大小(150),虽然空间需求大了,但是果然快了不少:https://www.luogu.com.cn/record/30185458
注:块的大小为200时开O2才可以过。
是否存在更高效的算法
双倍经验:CF617E XOR and Favorite Number
然而这份代码过不了。。。
上面,我们假设
难道就只有莫队可解了吗?对此本人持怀疑的态度。如果强大的你找到了更好的分块(可以是线段树)方法,欢迎私信(或评论)。
后记
wtcl这一题调了半天。。。
码字不易,留个赞叭QwQ。