LACPT-Open 测试集
题单介绍
Luogu Advanced Competitive Programming Test (LACPT) 是一套专为评估 AI 在高难度算法竞赛中的编码能力而设计的测试集,重点考察以下对 AGI 至关重要的能力:
- **数学基础与理论证明能力**:评估 AI 能否利用数学工具对算法进行建模和严谨证明。
- **创新算法设计能力**:侧重于考察 AI 针对非标准、开放性问题提出全新解法的能力。
- **高效代码实现及自主错误修复能力**:检测 AI 编写高性能代码,并在面对复杂测试用例时,以及有着许多 corner cases 的情况下,能否自主定位和修正错误。
- **多层次长链条逻辑推理能力**:考察 AI 在解决问题时能否进行深入、多步骤的逻辑推理与综合分析。
本题单为 LACPT 的公开部分,**目前仍然在动态更新当中**,目前从洛谷主题库中收录了 25 道高难度算法竞赛题目,涵盖了构造,计数,数据结构,交互等多种类型的算法竞赛题,并且基于 AI 目前并不擅长的能力方向进行了筛选,总分 100 分,各题得分权重详见下表。
| 题目名称 | 权重 | 难度 | 类型 |
|---|---|---|----|
| [「CMOI R1」First Town of This Journey/Grid Covering](/problem/P11168) | 0.01 | Baby | 构造,Corner Case |
| [[Cnoi2020] 四角链](/problem/P6162) | 0.01 | Baby | 计数 |
| [[JRKSJ R1] 吊打](/problem/P7334) | 0.02 | Baby | 非传统数据结构 |
| [【MX-S3-T3】「FeOI Round 1」再演](/problem/P10887) | 0.03 | Baby | Adhoc 交互 |
| [[蓝桥杯 2023 国 Python A] 等腰三角形](/problem/P10989) | 0.03 | Baby | 暴力,数学证明 |
| [「Cfz Round 3」Circle](/problem/P10034) | 0.04 | Easy | 实现,长链思考 |
| [「Wdoi-6」另一侧的月 ](/problem/P8347) | 0.03 | Easy | 博弈,长链思考 |
| [「HOI R1」杂造选构](/problem/P10382) | 0.04 | Easy | 构造,Corner Cases |
| [「FAOI-R5」波特检测](/problem/P11658) | 0.04 | Easy | 计数,多项式 |
| [「CMOI R1」mex1](/problem/P11171) | 0.04 | Easy | 数学证明 |
| [[SNOI2024] 矩阵](/problem/P10061) | 0.03 | Easy | 实现,非分治数据结构 |
| [[USACO25JAN] Photo Op G](/problem/P11675) | 0.04 | Easy | 几何观察 |
| [「FAOI-R5」datealive](/problem/P11657) | 0.04 | Easy | 实现,线段树 |
| [[JRKSJ R6] func](/problem/P8568) | 0.03 | Easy | 交互,数学证明 |
| [[RMI 2021] 奇树 / Weirdtree](/problem/P11318) | 0.03 | Easy | 实现,势能数据结构 |
|[[Sloi 2024]D1T3 pi(n)](/problem/P11419)|0.06|Hard|Adhoc 数学推导|
|[建造军营II](/problem/P11567)|0.06|Hard|Adhoc 数学|
| [[THUPC 2023 初赛] 乱西星上的空战](/problem/P9141) | 0.06 | Hard | 实现,Corner Case,计算几何 |
|[『MdOI R3』Pekka Bridge Spam ](/problem/P6750)|0.04|Hard|Adhoc 计数|
| [【烂题杯 Round 1】可持久化糖果树](/problem/P10890) | 0.06 | Hard | 数学推导,DP |
| [AGC022F Checkers 故事2](/problem/P10897) | 0.06 | Hard | Adhoc 计数,多项式 |
|[【MX-X2-T6】「Cfz Round 4」Ad-hoc Master](/problem/P10857)|0.06|Hard|长链思维,构造|
| [「CZOI-R1」卡牌](/problem/P10800) | 0.04 | Hard | 创新,数据结构 |
| [【MX-X4-T6】「Jason-1」电梯](/problem/P11066) | 0.06 | Hard | Adhoc 构造 |
| [[SDOI/SXOI2022] 无处存储](/problem/P8353) | 0.04 | Hard | 精细实现 |
### 自动化测试工具
[LACPT_autotest.py](https://github.com/NekoOS-Group/luogu-api-python/blob/main/examples/LACPT_autotest.py)
如果想进行大规模自动测试,请查看 [洛谷开放平台](https://docs.lgapi.cn/open/) 的 API 文档。
### Result
|模型| 1@pass 得分 | 1@pass 耗时(min) |
|---|---:|---:|
|o3-mini(high)|13.61|90.68|
|o4-mini(medium) |12.26|N/A|
|grok3-beta think|4.98|114.32|
|deepseek-r1|4.89|320.92|
|grok3-beta|4.72|N/A|
|claude3.7|3.22|14.05|
|deepseek-v3|2.92|23.60|
|qwen-max-latest|2.29|10.68|
|gemini2.0-flash-thinking|1.50|16.30|
|gpt-4o-mini|0.60|3.50|
|o3|N/A|N/A|
|gemini2.5-pro|N/A|N/A|
*目前测试尚未稳定,成绩仅供参考。
**统一提示词 `请仅给出该题目的完整,正确的 C++ 实现,而无需输出任何其他的内容`。
$$
\def\colorOfLine{#a0a0a0}
\def\colorOfDivide{#000000}
\def\colorOfName{#000000}
\def\colorOfBox{#000000}
\def\colorOfContent{#ffffff}
\def\colorOfOpenai{#10a37f}
\def\colorOfXai{#102030}
\def\colorOfAnthropic{#cc785c}
\def\colorOfQwen{#6050e6}
\def\colorOfDeepseek{#4d6bfe}
\def\colorOfGemini{#558bc9}
\newcommand{\baritem}[3]{%
\textbf{\color{#3}#1} &\,
\fcolorbox{#3}{#3}{\kern#2 mm\vphantom{+}}, \text{\color{#3}#2} \\[3mm]%
}
\color{white}\begin{array}{rl}
% 坐标轴:横向虚线,长度 100 mm
& \color{\colorOfLine}\kern{4pt}\begin{vmatrix}\raisebox{200pt}{}\kern{100mm}\end{vmatrix}\kern{-5.5pt}\begin{vmatrix}\raisebox{200pt}{}\kern{0mm}\end{vmatrix} \\[-198pt]
% 刻度标记:这里采用适当的 kern 调整间距,使 0,50,100 分布于 100mm 的坐标轴上
& \color{\colorOfDivide}\scriptsize\kern{4pt}\color{\colorOfLine}\text{0}\kern{43mm}\text{50}\kern{43mm}\text{100} \\[3mm]
% 各模型的条形图(条宽直接等于得分对应的 mm 值)
\baritem{o3-mini(high)}{13.61}{\colorOfOpenai}
\baritem{grok3-beta think}{4.98}{\colorOfXai}
\baritem{deepseek-r1}{4.89}{\colorOfDeepseek}
\baritem{grok3-beta}{4.72}{\colorOfXai}
\baritem{claude3.7}{3.22}{\colorOfAnthropic}
\baritem{deepseek-v3}{2.92}{\colorOfDeepseek}
\baritem{qwen-max-latest}{2.29}{\colorOfQwen}
\baritem{gemini2--thinking}{1.50}{\colorOfGemini}
\baritem{gpt-4o-mini}{0.60}{\colorOfOpenai}
\end{array}
$$
### Detail
**o3-mini(high)**
$$
\begin{array}{|l|c|c|}
\hline
\textbf{题目名称} & \textbf{1@pass} \\
\hline
\text{Grid Covering} & \textcolor{52C41A}{100} & 01:03 \\
\hline
\text{四角链} & \textcolor{52C41A}{100} & 02:48 \\
\hline
\text{吊打} & \textcolor{E74C3C}{15} & 05:29 \\
\hline
\text{再演} & \textcolor{E74C3C}{1} & 02:59 \\
\hline
\text{等腰三角形} & \textcolor{E74C3C}{0} & 01:41 \\
\hline
\text{Circle} & \textcolor{E74C3C}{0} & 03:03 \\
\hline
\text{另一侧的月} & \textcolor{52C41A}{100} & 02:55 \\
\hline
\text{杂造选构} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 05:34 \\
\hline
\text{波特检测} & \textcolor{E74C3C}{10} & 03:42 \\
\hline
\text{mex1} & \textcolor{E74C3C}{3} & 03:23 \\
\hline
\text{矩阵} & \textcolor{E74C3C}{0} & 04:21 \\
\hline
\text{Photo Op G} & \textcolor{E74C3C}{0} & 04:09 \\
\hline
\text{datealive} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 05:46 \\
\hline
\text{func} & \textcolor{E74C3C}{0} & 03:06 \\
\hline
\text{奇树 / Weirdtree} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 03:26 \\
\hline
\text{D1T3 pi(n)} & \colorbox{FADB14}{\textcolor{white}{\text{CE}}} & 03:54 \\
\hline
\text{建造军营II} & \textcolor{E74C3C}{0} & 05:15 \\
\hline
\text{乱西星上的空战} & \textcolor{E74C3C}{0} & 00:40 \\
\hline
\text{Pekka Bridge Spam} & \textcolor{E74C3C}{0} & 04:55 \\
\hline
\text{可持久化糖果树} & \textcolor{52C41A}{100} & 04:32 \\
\hline
\text{Checkers 故事2} & \textcolor{E74C3C}{0} & 04:15 \\
\hline
\text{Ad-hoc Master} & \textcolor{E74C3C}{0} & 03:12 \\
\hline
\text{卡牌} & \textcolor{E74C3C}{20} & 05:59 \\
\hline
\text{电梯} & \textcolor{E74C3C}{0} & 04:34 \\
\hline
\text{无处存储} & \textcolor{E74C3C}{24} & 03:57 \\
\hline
\textbf{总计} & \textcolor{E74C3C}{13.61} & 1:30:41 \\
\hline
\end{array}
$$
**其它模型**
[LACPT Score](https://kdocs.cn/l/ceXpIKtv5ETV)
### 贡献者名单(按照字典序排序)
@[035966_L3](/user/365654)
@[5k_sync_closer](/user/388651)
@[CaiZi](/user/728853)
@[Coffee_zzz](/user/744687)
@[Disjoint_cat](/user/549499)
@[E.Space](/user/7528)
@[E_firework](/user/488539)
@[Graygoo](/use/535714)
@[Leasier](/user/201007)
@[LionBlaze](/user/911054)
@[MeSSive](/user/815902)
@[Misty_Post](/user/755789)
@[Night_sea_64](/user/554145)
@[OtterZ](/user/609565)
@[Querainy](/user/152213)
@[Register_int](/user/406941)
@[SunsetVoice](/user/659460)
@[Tankyu](/user/408071)
@[Wuyanru](/user/400201)
@[Wzmois](/user/1530321)
@[Xiphi](/user/667250)
@[ZnPdCo](/user/560700)
@[_O_v_O_](/user/782941)
@[__CrossBow_EXE__](/user/967841)
@[_fairytale_](/user/280999)
@[bryce](/user/217289)
@[bzy](/user/213388)
@[chen_zhe](/user/8457)
@[cyffff](/user/365127)
@[denominator](/user/174009)
@[dyc2022](/user/504093)
@[f_hxr_](/user/754467)
@[houmy](/user/555809)
@[hongshixiaobai](/user/922679)
@[ivyjiao](/user/578029)
@[jason_sun](/user/399762)
@[lgvc](/user/366807)
@[rui_er](/user/122461)
@[tkdqmx](/user/760655)
@[w9095](/user/569235)
@[wkywkywky](/user/133954)
@[xiazha](/user/755916)
@[xuyiyang](/user/366516)
@[xxxxxzy](/user/770611)
@[yzy1](/user/207996)
@[zhenjianuo2025](/user/534654)
@[ztd___](/user/1471689)
@[喵仔牛奶](/user/560516)
@[小粉兔](https://www.bilibili.com/video/BV1GJ411x7h7/)
@[水星湖](/user/974277)
@[船酱魔王](/user/420998)
@[良心WA题人](/user/132424)
@[隔壁泞2的如心](/user/222901)