在2025年国际数学奥林匹克竞赛(IMO)官方的特别邀请下,小艺AI竞赛Agent亮相本届全球顶尖的数学赛事。经过三天的激烈角逐,小艺AI竞赛Agent成功攻克6道难题中的5道,以34分的优异成绩摘得银牌,距离金牌分数线(35分)仅1分之差。这一历史性的突破,标志着华为AI的逻辑推理能力达到了一个新的高度。
IMO主席Gregor Dolinar教授对华为AI的表现给予了高度评价:“华为AI提交的答卷获得了34分(满分42分),这是一个了不起的成就。(The Huawei AI scripts received a grade of 34 out of 42, which is a remarkable result.)”
不止于答题:小艺AI竞赛Agent展现专家级解题艺术
与传统模型追求解题套路不同,小艺AI竞赛Agent在解题过程中展现了接近顶尖解题方式的创造力和严密性:
专家级推理能力:小艺AI竞赛Agent完美攻克第1至第4题,均获满分(7分)。其论证过程严谨、逻辑自洽、可读性强,此外在第3题中还灵活运用了“升幂定理”等技巧,展现了深厚的数学知识储备。值得说明的是第5题,评审组确认,尽管Agent因对平局情况的表述存在细微瑕疵被扣1分,但其核心思维过程已完整包含了对该情况的严谨证明。这表明,它实际上已具备了解答该题所需的全部数学能力。
闪耀的解题灵感:在第2题的证明中,小艺AI竞赛Agent精准预测并添加了唯一一个辅助点,便完成了整个复杂证明的生成。其解法之高效、思路之凝练,显著优于已知的公开解法。
接近完美的思考深度:第1题的解答思路流程完整,清晰简洁,对于n=3的情况讨论充分,归纳过程严谨;同时在第4题的解答中对所有情况讨论完备,证明的结构层级分明,易于理解。
> 对IMO竞赛感兴趣的开发者,可以前往GitHub了解小艺AI竞赛Agent完整的赛题解答,链接:https://github.com/Huawei-xiaoyi/IMO2025-solutions
技术揭秘:驱动巅峰表现的“双脑”协同架构
小艺AI竞赛Agent的卓越表现,源于其创新的“自然语言大模型 + 形式化证明”协同架构。这套系统如同一个拥有“左右脑”的数字大脑,将人类的直觉创造与机
器的严谨验证无缝融合。
1、思维风暴与“AI同行评审”:孕育创造性解法
面对难题,小艺AI竞赛Agent首先通过并行采样生成海量、多样化的解题思路,如同进行一场“思维风暴”。随后,启动独特的“AI同行评审”机制,让不同的AI模型互相审阅、辩论、评分,从而筛选出最优的思路路径。这一过程还会融合形式化证明的反馈,指导AI模型进行多轮自我修复与迭代优化,极大提升了模型攻克精英级难题的创造力。
2、迭代式多层级证明:构建严密的逻辑闭环
为克服高复杂度数学证明严谨性的挑战,华为小艺团队设计了迭代式多层级并行证明系统。该系统首先将复杂的证明目标分解为树状的多层级子问题,然后由形式化证明模型自下而上地对每个子节点进行大规模并行验证。一旦某个环节证明失败,具备反思和自我修正能力的模型将立刻启动修复流程,直至整个逻辑链条完美闭环。
里程碑与新起点:共探AI与教育的未来
此次赛事的成果,不仅是华为AI发展的重要里程碑,更充分地证明了基于大语言模型(LLM)的多Agent协同系统在解决高阶数学问题上的强大潜力。
与此同时华为小艺团队也意识到,当前系统在面对极高复杂度的数学问题时(如本届IMO第6题)仍有局限,未来将会继续提升小艺的抽象推理与问题建模能力,持续向高阶数学推理探索。
据悉,小艺AI竞赛Agent的核心能力,未来将逐步赋能于小艺教育Agent。华为小艺团队或将以白名单机制,优先向数学及AI领域的专业研究者开放,旨在共同推动智能解题方法论的创新,让顶级的思维能力普惠每一位学习者。
