Luogu Advanced Competitive Programming Test (LACPT) 是一套专为评估 AI 在高难度算法竞赛中的编码能力而设计的测试集,重点考察以下对 AGI 至关重要的能力:
- 数学基础与理论证明能力:评估 AI 能否利用数学工具对算法进行建模和严谨证明。
- 创新算法设计能力:侧重于考察 AI 针对非标准、开放性问题提出全新解法的能力。
- 高效代码实现及自主错误修复能力:检测 AI 编写高性能代码,并在面对复杂测试用例时,以及有着许多 corner cases 的情况下,能否自主定位和修正错误。
- 多层次长链条逻辑推理能力:考察 AI 在解决问题时能否进行深入、多步骤的逻辑推理与综合分析。
本题单为 LACPT 的公开部分,目前仍然在动态更新当中,目前从洛谷主题库中收录了 25 道高难度算法竞赛题目,涵盖了构造,计数,数据结构,交互等多种类型的算法竞赛题,并且基于 AI 目前并不擅长的能力方向进行了筛选,总分 100 分,各题得分权重详见下表。
| 题目名称 |
权重 |
难度 |
类型 |
| 「CMOI R1」First Town of This Journey/Grid Covering |
0.01 |
Baby |
构造,Corner Case |
| [Cnoi2020] 四角链 |
0.01 |
Baby |
计数 |
| [JRKSJ R1] 吊打 |
0.02 |
Baby |
非传统数据结构 |
| 【MX-S3-T3】「FeOI Round 1」再演 |
0.03 |
Baby |
Adhoc 交互 |
| [蓝桥杯 2023 国 Python A] 等腰三角形 |
0.03 |
Baby |
暴力,数学证明 |
| 「Cfz Round 3」Circle |
0.04 |
Easy |
实现,长链思考 |
| 「Wdoi-6」另一侧的月 |
0.03 |
Easy |
博弈,长链思考 |
| 「HOI R1」杂造选构 |
0.04 |
Easy |
构造,Corner Cases |
| 「FAOI-R5」波特检测 |
0.04 |
Easy |
计数,多项式 |
| 「CMOI R1」mex1 |
0.04 |
Easy |
数学证明 |
| [SNOI2024] 矩阵 |
0.03 |
Easy |
实现,非分治数据结构 |
| [USACO25JAN] Photo Op G |
0.04 |
Easy |
几何观察 |
| 「FAOI-R5」datealive |
0.04 |
Easy |
实现,线段树 |
| [JRKSJ R6] func |
0.03 |
Easy |
交互,数学证明 |
| [RMI 2021] 奇树 / Weirdtree |
0.03 |
Easy |
实现,势能数据结构 |
| [Sloi 2024]D1T3 pi(n) |
0.06 |
Hard |
Adhoc 数学推导 |
| 建造军营II |
0.06 |
Hard |
Adhoc 数学 |
| [THUPC 2023 初赛] 乱西星上的空战 |
0.06 |
Hard |
实现,Corner Case,计算几何 |
| 『MdOI R3』Pekka Bridge Spam |
0.04 |
Hard |
Adhoc 计数 |
| 【烂题杯 Round 1】可持久化糖果树 |
0.06 |
Hard |
数学推导,DP |
| AGC022F Checkers 故事2 |
0.06 |
Hard |
Adhoc 计数,多项式 |
| 【MX-X2-T6】「Cfz Round 4」Ad-hoc Master |
0.06 |
Hard |
长链思维,构造 |
| 「CZOI-R1」卡牌 |
0.04 |
Hard |
创新,数据结构 |
| 【MX-X4-T6】「Jason-1」电梯 |
0.06 |
Hard |
Adhoc 构造 |
| [SDOI/SXOI2022] 无处存储 |
0.04 |
Hard |
精细实现 |
自动化测试工具
LACPT_autotest.py
如果想进行大规模自动测试,请查看 洛谷开放平台 的 API 文档。
Result
| 模型 |
1@pass 得分 |
1@pass 耗时(min) |
| o3-mini(high) |
13.61 |
90.68 |
| o4-mini(medium) |
12.26 |
N/A |
| grok3-beta think |
4.98 |
114.32 |
| deepseek-r1 |
4.89 |
320.92 |
| grok3-beta |
4.72 |
N/A |
| claude3.7 |
3.22 |
14.05 |
| deepseek-v3 |
2.92 |
23.60 |
| qwen-max-latest |
2.29 |
10.68 |
| gemini2.0-flash-thinking |
1.50 |
16.30 |
| gpt-4o-mini |
0.60 |
3.50 |
| o3 |
N/A |
N/A |
| gemini2.5-pro |
N/A |
N/A |
*目前测试尚未稳定,成绩仅供参考。
**统一提示词 请仅给出该题目的完整,正确的 C++ 实现,而无需输出任何其他的内容。
\def\colorOfLine{#a0a0a0}
\def\colorOfDivide{#000000}
\def\colorOfName{#000000}
\def\colorOfBox{#000000}
\def\colorOfContent{#ffffff}
\def\colorOfOpenai{#10a37f}
\def\colorOfXai{#102030}
\def\colorOfAnthropic{#cc785c}
\def\colorOfQwen{#6050e6}
\def\colorOfDeepseek{#4d6bfe}
\def\colorOfGemini{#558bc9}
\newcommand{\baritem}[3]{%
\textbf{\color{#3}#1} &\,
\fcolorbox{#3}{#3}{\kern#2 mm\vphantom{+}}, \text{\color{#3}#2} \\[3mm]%
}
\color{white}\begin{array}{rl}
% 坐标轴:横向虚线,长度 100 mm
& \color{\colorOfLine}\kern{4pt}\begin{vmatrix}\raisebox{200pt}{}\kern{100mm}\end{vmatrix}\kern{-5.5pt}\begin{vmatrix}\raisebox{200pt}{}\kern{0mm}\end{vmatrix} \\[-198pt]
% 刻度标记:这里采用适当的 kern 调整间距,使 0,50,100 分布于 100mm 的坐标轴上
& \color{\colorOfDivide}\scriptsize\kern{4pt}\color{\colorOfLine}\text{0}\kern{43mm}\text{50}\kern{43mm}\text{100} \\[3mm]
% 各模型的条形图(条宽直接等于得分对应的 mm 值)
\baritem{o3-mini(high)}{13.61}{\colorOfOpenai}
\baritem{grok3-beta think}{4.98}{\colorOfXai}
\baritem{deepseek-r1}{4.89}{\colorOfDeepseek}
\baritem{grok3-beta}{4.72}{\colorOfXai}
\baritem{claude3.7}{3.22}{\colorOfAnthropic}
\baritem{deepseek-v3}{2.92}{\colorOfDeepseek}
\baritem{qwen-max-latest}{2.29}{\colorOfQwen}
\baritem{gemini2--thinking}{1.50}{\colorOfGemini}
\baritem{gpt-4o-mini}{0.60}{\colorOfOpenai}
\end{array}
Detail
o3-mini(high)
\begin{array}{|l|c|c|}
\hline
\textbf{题目名称} & \textbf{1@pass} \\
\hline
\text{Grid Covering} & \textcolor{52C41A}{100} & 01:03 \\
\hline
\text{四角链} & \textcolor{52C41A}{100} & 02:48 \\
\hline
\text{吊打} & \textcolor{E74C3C}{15} & 05:29 \\
\hline
\text{再演} & \textcolor{E74C3C}{1} & 02:59 \\
\hline
\text{等腰三角形} & \textcolor{E74C3C}{0} & 01:41 \\
\hline
\text{Circle} & \textcolor{E74C3C}{0} & 03:03 \\
\hline
\text{另一侧的月} & \textcolor{52C41A}{100} & 02:55 \\
\hline
\text{杂造选构} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 05:34 \\
\hline
\text{波特检测} & \textcolor{E74C3C}{10} & 03:42 \\
\hline
\text{mex1} & \textcolor{E74C3C}{3} & 03:23 \\
\hline
\text{矩阵} & \textcolor{E74C3C}{0} & 04:21 \\
\hline
\text{Photo Op G} & \textcolor{E74C3C}{0} & 04:09 \\
\hline
\text{datealive} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 05:46 \\
\hline
\text{func} & \textcolor{E74C3C}{0} & 03:06 \\
\hline
\text{奇树 / Weirdtree} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 03:26 \\
\hline
\text{D1T3 pi(n)} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 03:54 \\
\hline
\text{建造军营II} & \textcolor{E74C3C}{0} & 05:15 \\
\hline
\text{乱西星上的空战} & \textcolor{E74C3C}{0} & 00:40 \\
\hline
\text{Pekka Bridge Spam} & \textcolor{E74C3C}{0} & 04:55 \\
\hline
\text{可持久化糖果树} & \textcolor{52C41A}{100} & 04:32 \\
\hline
\text{Checkers 故事2} & \textcolor{E74C3C}{0} & 04:15 \\
\hline
\text{Ad-hoc Master} & \textcolor{E74C3C}{0} & 03:12 \\
\hline
\text{卡牌} & \textcolor{E74C3C}{20} & 05:59 \\
\hline
\text{电梯} & \textcolor{E74C3C}{0} & 04:34 \\
\hline
\text{无处存储} & \textcolor{E74C3C}{24} & 03:57 \\
\hline
\textbf{总计} & \textcolor{E74C3C}{13.61} & 1:30:41 \\
\hline
\end{array}
其它模型
LACPT Score
贡献者名单(按照字典序排序)
@035966_L3
@5k_sync_closer
@CaiZi
@Coffee_zzz
@Disjoint_cat
@E.Space
@E_firework
@Graygoo
@Leasier
@LionBlaze
@MeSSive
@Misty_Post
@Night_sea_64
@OtterZ
@Querainy
@Register_int
@SunsetVoice
@Tankyu
@Wuyanru
@Wzmois
@Xiphi
@ZnPdCo
@_O_vO
@__CrossBow_EXE__
@fairytale
@bryce
@bzy
@chen_zhe
@cyffff
@denominator
@dyc2022
@fhxr
@houmy
@hongshixiaobai
@ivyjiao
@jason_sun
@lgvc
@rui_er
@tkdqmx
@w9095
@wkywkywky
@xiazha
@xuyiyang
@xxxxxzy
@yzy1
@zhenjianuo2025
@ztd___
@喵仔牛奶
@小粉兔
@水星湖
@船酱魔王
@良心WA题人
@隔壁泞2的如心