题解：P1763 埃及分数

CNS_5t0_0r2 · 2024-04-02 13:24:34 · 题解

update on 2024-8-16：

修正代码的错误。

【-1】前言

这题的剪枝真的太妙了，很难想象巨佬是怎么独立想出来这所有的剪枝的。

本题解没有包含所有的剪枝，只选了我认为最好理解的几条剪枝。

想学习所有的剪枝的右转巨佬的题解。

【1】本题大框架：迭代加深搜索（IDDFS）

看到 1 < a < b < 1000，可以猜测分数的个数不会很多，考虑搜索。

那么怎么搜？因为我们不能确定最少分数的个数（这是我们首要要求的），可以考虑枚举分数的个数再进行搜索。

这相当于每次限制了搜索树的深度，当确定一个深度发现了解，深度就不会再加深。

这种每次限制了深度的搜索就叫迭代加深搜索（IDDFS）（又称 IDS）。

我们明显感觉到，每次限制深度为 dep，那么搜索深度为 dep + 1 时，搜索深度 dep 对应的搜索树又会被重新搜一遍。浪费了一些时间。

所以这种搜索有什么优势呢？

如果我们不限定深度，那么我们可能花大力气搜出了一个答案但远没达到最优解（分数的个数超过正解），此时再及时回溯已经很难了（搜索树深度增加一层增加的节点数是指数级的），浪费的时间会更多。

const int N = 11,INF = 1e7;//N为层数上限，INF为分母最大值
void dfs(int a,int b,int x){//(a/b)表示剩余分数大小，x表示当前搜索深度
    if(x > dep)//超过了限定深度，退出
        return;
    if(a == 1){//找到了解（此时x一定等于限定的深度dep，否则在dep更小的时候就会找到解）
        if(b > tmp[x - 1]){//如果当前的分母比上
            st[x] = b;
            if(!flag || tmp[x] < ans[x])//找到了更优解
                for(int i = 1;i <= dep;i++)
                    ans[i] = tmp[i];
        }
        flag = 1;//标记为已经找到了答案
        return;
    }
    int l = max((b + a - 1) / a,tmp[x - 1] + 1),r = min((dep - x + 1) * b / a,INF);//下一个分数分母的上下界
    if(flag && r >= ans[dep])
        r = ans[dep] - 1;
    for(int i = l;i <= r;i++){
        tmp[x] = i;
        //请自行模拟分数加减法
        int A = a * i - b,B = b * i;
        int gcd = GCD(A,B);
        dfs(A / gcd,B / gcd,x + 1);
    }
}
signed main(){
    a = read();b = read();
    c = GCD(a,b);
    a /= c;b /= c;
    tmp[0] = 1;
    for(dep = 1;dep <= N - 1;dep++){//枚举深度
        dfs(a,b,1);
        if(flag){找到了答案
            for(int i = 1;i <= dep;i++)
                printf("%lld ",ans[i]);
            return 0;
        }
    }
    return 0;
}

【2】初步剪枝

~~其实在上方的代码中已经给出了。~~

就是这一段：

int l = max((b + a - 1) / a/*(b + a - 1) / a = ceil(b / a)*/,tmp[x - 1] + 1);
int r = min((dep - x + 1) * b / a,INF);//下一个分数分母的上下界
if(flag && r >= ans[dep])
    r = ans[dep] - 1;

考虑上下界剪枝。

先考虑下界 l。这段代码中，tmp_{x - 1} 为上一个分数的分母，按照题目要求，下一个分数的分母要更大，所以下界 l 至少为 tmp_{x - 1} + 1。又因为当前填的分数不能超过当前剩余的分数 \frac{a}{b}，所以有 \frac{1}{tmp_{x}} \leq \frac{a}{b}，移项得 tmp_{x} \geq \frac{b}{a}。又因为 tmp_{x} 为正整数，所以 tmp_{x} \geq \lceil \frac{b}{a} \rceil。综上，下界 l =\max(tmp_{x - 1} + 1,\lceil \frac{b}{a} \rceil)。

上界 r 呢？由题意，tmp_{x + 1},tmp_{x + 2},\dots,tmp_{dep} \geq tmp_{x}，所以这些数的倒数小于 \frac{1}{tmp_{x}}，那么这些数倒数的和（包括 \frac{1}{tmp_{x}}）小于这些数的个数乘 \frac{1}{tmp_{x}}，即小于 \frac{dep - x + 1}{tmp_{x}}。但这些数的和刚好等于当前的 \frac{a}{b}，所以 \frac{dep - x + 1}{tmp_{x}} > \frac{a}{b}，移项得 tmp_x < \frac{b(dep - x + 1)}{a}，又因为 tmp_x 为正整数，所以 tmp_x \leq \lfloor \frac{b(dep - x + 1)}{a} \rfloor。题目中还说了最小的分数 \geq \frac{1}{10^7}，所以上界 r 不会超过 10^7，综合有 r = \min(\lfloor \frac{b(dep - x + 1)}{a} \rfloor,10^7)。

这里还有个小优化：当发现已经找到了解，那么如果当前的分数小于当前找到的最优解中最小的分数，那么接下来搜索到的解不会更优。

【3】神奇的剪枝

加了上下界剪枝依然无法通过本题，因为本题有一个很强的数据：

570 877

所以还要继续剪枝。

【3.1】神奇的剪枝 1：

我们发现，限制深度可以大大优化搜索，那么是否可以每次限制一些其它参数，进一步优化搜索呢？

题目还要求最小的分数越大越好，即最小的分数分母越小越好，考虑每次限制分母的最大值 A。

我的枚举是这样的：

限制深度为 dep 时，先设 A = 10^5（这个可以自己调），因为规定了最小的分数分母小于 10 ^ 7，所以 A \leq 10^7。

如果每次将 A 加 1，那么这个剪枝就没有任何意义了。因为这要求 A 的初值很接近 10 ^ 7 才能避免超时，而两个相差 1 的 A 对应的搜索树基本一致，相当于重复搜了很多次。

所以，我们每次将 A 乘 10，有了这个限制，就可以对搜索进行优化。

因为题目首要满足的是分数个数尽可能小，所以枚举深度的循环在外层。

for(dep = 1;dep <= N - 1;dep++){//枚举深度
    ans[dep] = tmp[dep] = INF + 1;
    for(max_a = 100000;max_a <= INF;max_a *= 10){//即原文的A
        dfs(a,b,1);
        if(flag){//找到了答案
            for(int i = 1;i <= dep;i++)
                cout << ans[i] << ' ';
            return 0;
        }
    }
}

【3.2】神奇的剪枝 2：

这是本题最难想到但也是最妙的地方。

每次层数最深的地方搜索树的节点个数巨大，考虑对最深的两层优化。

根据题意，在 x = dep - 1（倒数第二层）时，当前的 \frac{a}{b} = \frac{1}{p} + \frac{1}{q} = \frac{p + q}{pq}(p < q,\gcd(a,b) = 1)，因为 a,b 互质，所以有：

p + q = ak \\ pq = bk \end{cases}

消元，得 q = ak - p，代入二式得 p(ak - p) = bk，整理得 p^2 - akp + bk = 0。

这是一个关于 p 的一元二次方程，要求满足有正整数解，考虑枚举参数 k。

因为是一元二次方程，所以有 \Delta = a^2k^2 - 4bk \geq 0，解这个关于 k 的一元二次不等式得 k \geq \frac{4b}{a^2} 或 k \leq 0。又因为 k 为正整数，所以 k \geq \lceil \frac{4b}{a^2} \rceil。

继续解方程，得 p_1 = \frac{ak + \sqrt{\Delta}}{2},p_2 = \frac{ak - \sqrt{\Delta}}{2}，要求为正整数，则 \Delta 为完全平方数且 2 | ak + \sqrt{\Delta}，所以当不满时直接跳过。否则，令 tmp_{dep - 1} = p_1,tmp_{dep} = p_2 即求得一组解。

这还没完，将 $ak = p_1 + p_2$ 代入原方程 $p^2 - akp + bk = 0$ 得 $bk = p_1p_2$，还是由 $p_1 < p_2 \leq A$，得 $p_1p_2 \leq A(A - 1)$，所以 $bk \leq A(A - 1)$ 得 $k \leq \lfloor \frac{A(A - 1)}{b} \rfloor$。综上，$k$ 的上界 $r = \min(\lfloor \frac{2A}{a} \rfloor,\lfloor \frac{A(A - 1)}{b} \rfloor)$。 ```cpp if(x == dep - 1){ const int l = ((b << 2) / (a * a)) + 1,r = min(((max_a << 1)) / a,max_a * (max_a - 1) / b); for(int i = l;i <= r;i++){ int delta = a * a * i * i - ((b * i) << 2); int Sqrt = sqrt(delta); if(Sqrt * Sqrt != delta/*delta不为完全平方数*/ || ((a * i - Sqrt) & 1)) continue; tmp[x] = (a * i - Sqrt) >> 1;tmp[x + 1] = (a * i + Sqrt) >> 1; if(!flag || tmp[dep] < ans[dep]){ for(int i = 1;i <= dep;i++) ans[i] = tmp[i]; flag = 1; } } return; } ``` **update on 2024-8-16：** 感谢用户 @[wangjingtang](https://www.luogu.com.cn/user/1216833) 提供的一个 hack： ``` 349 720 ``` 上面的代码会输出 ``5 9 9 16``，不符合题意，解决方法就是特判，当搜出不合法答案的时候直接跳过。 ```cpp if(x == dep - 1){ int l = ((b << 2) / (a * a)) + 1,r = min(((max_a << 1)) / a,max_a * max_a / b); for(int i = l;i <= r;i++){ int delta = a * a * i * i - ((b * i) << 2); int Sqrt = sqrt(delta); if(Sqrt * Sqrt != delta || ((a * i - Sqrt) & 1)) continue; tmp[x] = (a * i - Sqrt) >> 1;tmp[x + 1] = (a * i + Sqrt) >> 1; if(tmp[x] <= tmp[x - 1] || tmp[x + 1] <= tmp[x])//这里需要特判，否则可能会搜出不合法的答案 continue; if(!flag || tmp[dep] < ans[dep]){ for(int j = 1;j <= dep;j++) ans[j] = tmp[j]; flag = true; } } return; } ``` # AC code ```cpp #include<bits/stdc++.h> #define int long long using namespace std; const int N = 11,INF = 1e7; int dep;int max_a; int tmp[N],ans[N]; int a,b,c; bool flag; int GCD(const int x,const int y){ return y ? GCD(y, x % y) : x; } void dfs(const int a,const int b,const int x){ if(x > dep) return; if(a == 1){ tmp[x] = b; if(!flag || tmp[dep] < ans[dep]) for(int i = 1;i <= dep;i++) ans[i] = tmp[i]; flag = 1; return; } if(x == dep - 1){ int l = ((b << 2) / (a * a)) + 1,r = min(((max_a << 1)) / a,max_a * max_a / b); for(int i = l;i <= r;i++){ int delta = a * a * i * i - ((b * i) << 2); int Sqrt = sqrt(delta); if(Sqrt * Sqrt != delta || ((a * i - Sqrt) & 1)) continue; tmp[x] = (a * i - Sqrt) >> 1;tmp[x + 1] = (a * i + Sqrt) >> 1; if(tmp[x] <= tmp[x - 1] || tmp[x + 1] <= tmp[x]) continue; if(!flag || tmp[dep] < ans[dep]){ for(int j = 1;j <= dep;j++) ans[j] = tmp[j]; flag = true; } } return; } int l = max((b + a - 1) / a,tmp[x - 1] + 1); int r = min((((dep - x + 1) * b + a - 1) / a),max_a); if(flag && r >= ans[dep]) r = ans[dep] - 1; for(int i = l;i <= r;i++){ tmp[x] = i; const int A = a * i - b,B = b * i; const int gcd = GCD(A,B); dfs(A / gcd,B / gcd,x + 1); } } signed main(){ ios::sync_with_stdio(false); cin.tie(0);cout.tie(0); cin >> a >> b; c = GCD(a,b); a /= c;b /= c; tmp[0] = 1; for(dep = 1;dep <= N - 1;dep++){ ans[dep] = tmp[dep] = INF + 1; for(max_a = 100000;max_a <= INF;max_a *= 10){ dfs(a,b,1); if(flag){ for(int i = 1;i <= dep;i++) cout << ans[i] << ' '; return 0; } } } return 0; } ```