Shape 题解

· · 题解

题意简述

给定一个 n\times m0-1 矩阵,定义一个 H 形为一个长得像 H (感性理解,具体见题目描述)的图形,求有几个由 0 组成的 H 形。

例如下图图示(白色为 0,黑色为 1),一共有 6 个 H 形,这也告诉我们 H 形是可以互相有重叠甚至有包含关系的(但不同的 H 形不会完全恰好重合)。

题目分析

考虑到 n,m\leqslant 2\times 10^3。需要设计一个 n\times m (或带一个 log )的算法,直接暴力枚举四元组中的任意两个都无法完成,需要找到 H 形中的一个特性。

首先考虑是否可以枚举 H 的竖线(每个 H 有两个竖线,这里考虑左侧)。考场上糊了一个想法:记录每一条竖着的白线,以及每一个点往右可以到达的最近的点,图示情况可以后续推乘法原理加法原理的式子做到 \operatorname{O}{(1)}。随后很快发现了不可行,因为即使我记录了每一个点向右最多可以到达哪些点,整体判断一个 H 的两条竖线是否一一对应还是 \operatorname{O}{(n)} 的。

除此之外,即使两个 H 竖线部分是包含关系,也不一定代表横线部分重合,例如:

这两种情况都无法简单地区分,例如左侧这种,高度为 3 的 H 和高度为 9 的 H 竖线部分共线但是横线部分不共线。右侧这种情况说明不能只记录每一个白格子右侧第一个白格子,因为两个 H 可能只有一个竖线共线。

因此考虑竖线的情况比较难处理,又因为 H 里面只有一条横线,来考虑横线的情况。

对于任何一个 H,显然横线的两端刚好是竖线的中点。因此选择一个横线的两个端点,向上和向下延伸同样的高度(且都是白格子),就一定可以得出一个 H。

基于这种思想我们记录每一个格子向上最多可以延伸多少个格子,向下最多可以延伸多少个格子。

而显然一个横线两端的点向上和向下延伸的白格子应该是相同的,因此对于某一个格子而言,向上延伸和向下延伸的格子数取最小值,才会是以它为横线的一个端点,可能形成的高度最大的 H 的高度的一半。

(也就是 H 的最大高度为 \min{(up,dn)}\times 2+1)。

// a 数组为输入的 0-1 矩阵
for(register int j=1;j<=m;++j){
    for(register int i=1;i<=n;++i){
        if(a[i][j]) up[i][j]=0;
        else up[i][j]=up[i-1][j]+1;
    }// 向上
    for(register int i=n;i>=1;--i){
        if(a[i][j]) dn[i][j]=0;
        else dn[i][j]=dn[i+1][j]+1;
    }// 向下
for(register int i=1;i<=n;++i)
    for(register int j=1;j<=m;++j)
        s[i][j]=min(up[i][j],dn[i][j]);
// 取 min
// 注意 H 的真正高度为 s[i][j]*2-1
// 因为中间那一个白格子在这里也算进去了
}

通过放在最前面的第一张图,我们知道同一个横线上可能出现多个大小不同的 H。假设每个横线上有若干白格子。我们发现……

(注:下图的白格子高度指的是最底下一行的横线的 s

3 个可以和第 1,4,7,8,11,12,13 个匹配出一个 H,第 4 个可以和第 1,7,8,12,13 个匹配成一个 H……

发现高度小的一定可以和高度大于等于它的匹配。且按照这种方法匹配得出的 H 不重不漏。

因此可以每次取出一段白色的横线(设长度为 k),取出横线上每个点的 s 值,如果我们从小到大排个序,就会发现第 i 个一定可以和第 i+1,i+2,\dots,k 个匹配,一共有 k-i 个 H。

每一段白色的横线取出并逐个计算,累加答案。由于有一个排序,最多有 n 个长度为 m 的横线,因此总的复杂度为 \operatorname{O}{(n\times m\log m)} 的,可过。且只要有黑色的格子这东西就不会卡满。因此效率是非常可观的。

主要处理的部分:

    int i=1;j=1;
    while(i<n){
        while(a[i][j] && j<=m) ++j;

        if(j>m){ // 避免 j 越界
            ++i,j=1;
            continue;
        }

        tot=0;
        while(!a[i][j] && j<=m){ // 不要忘记 j<=m,会越界
            p[++tot]=s[i][j]-1; // 这里要-1(参见上面预处理代码注释)
            ++j;
        }

        std::sort(p+1,p+1+tot); // 小到大排序

        for(register int k=1;k<=tot;++k) ans+=p[k]*(tot-k);
        // 对于每一个 k 一共 tot-k 个 H 可以匹配

        if(j>m){ // 越界判断
            ++i,j=1;
            continue;
        }
    }

告诫后人

考场上本来用的优先队列 priority_queue,惨遭 TLE,个人觉得可能是因为其每次插入和删除都是 \log n,也就是两个 n\log n,因此整体带了一个常数(再加上 STL 可能还有常数)。而 sort 是一个 n\log n,后续处理是 n 的。整体常数小一些。

如果用优先队列 TLE 的话,如果算法没有错误可以改成直接存数组里再排序,说不定就 A 了呢~