超越国际数学奥林匹克金牌得主:谷歌 DeepMind AI 系统展现超强几何解题能力

xxn 阅读:73613 2025-02-08 08:00:53 评论:0

据报道,谷歌旗下的 DeepMind 实验室最新研发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛中的几何问题上取得了重大突破,其表现甚至超越了平均金牌得主。

AlphaGeometry2 是 DeepMind 最新发布的 AlphaGeometry 系统的升级版本。根据 DeepMind 最新公布的研究论文,AlphaGeometry2 能够解决过去 25 年国际数学奥林匹克竞赛中 84% 的几何问题。国际数学奥林匹克竞赛是一项面向高中生的数学竞赛,DeepMind 认为,发现解决复杂几何问题的新方法可能是实现更强大人工智能的关键。

证明数学定理或逻辑解释定理为何成立,需要推理能力以及从多种可能的步骤中选择解决方案的能力。实现这些解决问题的技能可能成为未来通用人工智能模型的重要组成部分。

值得一提的是,在去年夏天,DeepMind 展示了一个将 AlphaGeometry2 与 AlphaProof(一种用于形式化数学推理的 AI 模型)相结合的系统,成功解决了 2024 年国际数学奥林匹克竞赛中的一系列问题。类似的方法还可拓展到数学和科学的其他领域,为复杂的工程计算提供支持。

AlphaGeometry2 主要包含数个核心组件,包括谷歌 Gemini 系列 AI 模型中的语言模型和一个“符号引擎”。Gemini 模型与符号引擎协同工作,后者利用数学规则推导问题的解决方案,并为给定几何定理提供可行的证明。

考虑到将证明转化为 AI 可理解的格式存在挑战,可用的几何训练数据较为有限。因此,DeepMind 为 AlphaGeometry2 的语言模型创建了自己的合成数据,生成了超过 3 亿个不同复杂度的定理和证明。

研究团队选取了过去 25 年的国际数学奥林匹克竞赛中的 45 个几何问题,包括线性方程和需要在平面上移动几何对象的问题,并将其整合成一个更大的问题集(由于技术原因,某些问题需要拆分为两个)。根据研究论文,AlphaGeometry2 成功解决了其中的 42 个问题,超越了平均金牌得主得分 40.9。

然而,AlphaGeometry2 也存在一些限制。一项技术问题导致其无法解决涉及可变数量点、非线性方程和不等式的问题。尽管 AlphaGeometry2 不是第一个在几何问题上达到金牌水平的 AI 系统,但它是首个在如此庞大问题集上实现这一目标的系统。

在另一组更具挑战性的国际数学奥林匹克竞赛问题中,AlphaGeometry2 的表现稍显不足。DeepMind 团队挑选了 29 个由数学专家提名但尚未出现在竞赛中的问题,其中 AlphaGeometry2 只能解决其中的 20 个。

广告声明:文内含有对外跳转链接,用于传递更多信息,结果仅供参考。

声明

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

搜索
排行榜
关注我们

扫一扫关注我们,了解最新精彩内容