AI热点 2天前 77 阅读 0 评论

中国队重夺IMO奥数冠军,6金双满分碾压全场,AI连铜牌都拿不到

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

机器之心报道

编辑:泽南、杨文

祝贺中国队!

本周六早上传来消息,在国际数学奥林匹克竞赛 IMO(International Mathematical Olympiad)比赛上中国队重夺冠军,获得了六金、双满分的佳绩。

从「成绩单」来看,中国队总分 231 分,在前五道题目中获得全满分,第六题拿下团队 21 分也为全场最高分。

本届中国代表队名单:

  • 邓哲文(高二) 湖北省武昌实验中学
  • 徐祺铭(高二) 武汉市经开外国语高级中学
  • 谈弘毅(高二) 武汉市经开外国语高级中学
  • 张恒烨(高二) 重庆市巴蜀中学校
  • 董镇宇(高三) 杭州学军中学
  • 邓乐言(高一) 上海市上海中学

其中邓哲文和徐祺铭已连续两届入选国家队。自 1985 年中国队首次参加 IMO 以来,已有 17 位选手连续两届入选国家队,包括北京大学助理教授韦东奕,他曾在 2008、2009 年两次获得满分。

自 2019 年到 2023 年,中国队曾连续获得 IMO 冠军。

去年的冠军美国队本次获得了五金一银的成绩,位居第二。

第三名韩国队四金二银,第四名日本队三金二银一铜,其中加野聪一人获得满分金牌。

另外本届加拿大派出了纯华人的阵容,获得两金两银一铜位居第十二位,Warren Bei 获得了满分金牌。

国际数学奥林匹克竞赛(InternationaMathematical Olympiad,简称 IMO)是一项面向高中生的全球性数学竞赛,被誉为数学界的世界杯。

在 1959 年,该项赛事首次在罗马尼亚举办,目前 IMO 已经发展成为一个年度国际赛事,每年来自五大洲 100 多个国家和地区的数学顶尖少年竞相角逐。

今年的 IMO 是第 66 届,在澳大利亚昆士兰州阳光海岸举行,比赛自 7 月 15 日开始。这是继 1988 年澳大利亚堪培拉第 29 届 IMO 之后,澳大利亚第二次承办 IMO 赛事。

IMO 2025 题目

IMO 的竞赛题目通常包括六道,分为两天进行,每天的考试时间为 4.5 小时,参赛者每天需完成 3 道题目,每题 7 分,满分 42 分。试题内容涵盖代数、几何、数论、组合等多个领域,旨在测试选手的数学知识和解题能力。

金牌的分数线是 35 分,银牌 28 分,铜牌 19 分。今年的考题据说前五题对于顶级高手来说并不很难,因此共产生了 72 枚金牌,比去年多 19 个。

相比之下,第六题难度极高,全球仅 6 人破解,最后 5 人获满分。

第一题:

第二题:

第三题:

第四题:

第五题:

第六题:

大家觉得今年的题目难度如何,在评论区聊聊吧。

大模型 IMO2025 成绩:无人拿牌

最后,可能你也会关心 AI 大模型在最新真题上的成绩如何。在另一个「赛场」上,有人也已经完成了测试,没有一个大模型能拿到铜牌

其中,Gemini 2.5 Pro 表现最佳,得分为 31%(13 分)。在之前的 USAMO 评估中,Gemini 2.5 Pro 曾因在无法提供有效证明时引用不存在的定理而受到批评, 然而在 IMO 2025 的表现中,这种行为有所减少,表明模型在此方面有所改进。

刚刚发布的 Grok 4 成绩相对一般,许多初步回答非常简短,通常只是给出最终答案而没有任何解释,类似的问题在 MathArena 的其他基准测试中也有体现,Grok-4 的回答经常缺乏深度或证明。

在 MathArena 上,研究人员聘请了 IMO 级别人类评委进行评分,评估在 2025 年 IMO 题目发布后立即开始。平均而言,AI 做题每道题答案的生成成本至少为 3 美元。

看起来,在人类最高水平智力竞赛上,AI 的能力还有待进一步提升。

参考内容:

https://www.imo-official.org/results.aspx

https://matharena.ai/imo/

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!