数学界迎来AlphaGo时刻:谷歌AI用19秒答完一道IMO几何题,差1分即可摘金谷歌ai翻译人工智能imo大语言模型deepmind

近日,谷歌DeepMind宣布其人工智能系统在数学解题能力上取得了突破性进展。

在2024年国际数学奥林匹克竞赛(IMO,InternationalMathematicalOlympiad)的六道题目中,该公司的人工智能系统成功解决了其中的四道,获得了相当于银牌的成绩。

这标志着人工智能系统首次在这项全球顶级少年数学家竞赛中达到了奖牌级别的表现。

DeepMind开发了两个专门的人工智能系统AlphaProof和AlphaGeometry2,两者协作拿到了这一成绩。

AlphaProof解决了两道代数题和一道数论题,其中包括本次比赛中最难的一道题目。而AlphaGeometry2则成功解决了一道几何题,仅仅耗时19秒。未能完成的两道题属于组合数学的范畴。

这两个人工智能系统的总成绩获得了42分中的28分,仅差1分就达到了金牌的门槛。

IMO作为自1959年以来每年举办的重大数学赛事,一直吸引着全球精英学生参与。

比赛涵盖代数、组合数学、几何和数论等领域,题目难度极高。近年来,IMO问题的解决能力已成为评估人工智能系统数学推理能力的重要基准。

据DeepMind介绍,AlphaProof是一个基于强化学习的系统,它通过生成和验证数百万个证明来自我训练,逐步解决越来越困难的问题。该系统使用形式化语言Lean来证明数学陈述。

训练数据不足是常见的问题之一,为解决该问题,研究团队设计了一个额外的网络,试图将现有的百万个用自然语言写成的问题翻译成Lean语言,而不包含人工编写的答案。

AlphaGeometry2是谷歌之前几何解题人工智能模型的升级版本,现在由基于Gemini的语言模型驱动。它可以解决与物体运动以及涉及角度、比率和距离的方程式有关的问题。

由于它比其前身接受了更多合成数据的训练,因此能够解决更具挑战性的几何问题。

在尝试本次IMO之前,AlphaGeometry2能够解决过去25年IMO几何问题的83%,远高于其前身53%的成功率。

在今年的比赛中,该系统在接收到几何题的形式化版本后仅用19秒就找到了解决方法。

值得注意的是,人工智能系统解题的过程与人类参赛者有所不同。谷歌首先将IMO问题翻译成形式化的数学语言,然后交由人工智能模型处理。

而在正式比赛中,人类参赛者需要在两个4.5小时的环节中直接面对数学陈述。

尽管取得了令人瞩目的成就,但这项技术仍存在一些局限性。菲尔兹奖得主、著名数学家蒂莫西·高尔斯爵士(TimothyGowers)指出了几个关键的限制因素。

其次,数学题需要人工将其翻译成形式化语言Lean,然后人工智能模型才能开始工作。

虽然人工智能执行了最重要的数学推理,但这个“自动形式化”步骤仍需由人类完成。

此外,目前尚不清楚这种技术是否能扩展到其他数学领域,特别是那些训练数据较少的领域。

值得注意的是,人工智能系统未能解决两道组合数学问题,这表明它在某些数学领域还有待进步。

尽管存在这些限制,但专家们认为这项技术仍有巨大的潜力。高尔斯推测,这样的人工智能系统可能成为有价值的研究工具,能够帮助数学家回答广泛的问题,只要这些问题不太困难。这将极大地推动数学研究的发展。

剑桥大学专门研究数学和人工智能的研究员凯蒂·柯林斯(KatieCollins)指出,能够解决复杂数学问题的人工智能系统可能为“人类+人工智能”的协作模式开辟新的道路,帮助数学家解决和发明新类型的问题。

这反过来也可能帮助我们更好地理解人类是如何解决数学问题的。

谷歌DeepMind研究副总裁普什米特·科利表示,这是机器学习和人工智能领域的重大进展,迄今为止,还没有哪个系统能以这样的成功率和通用性来解决问题。

此外,作为IMO工作的一部分,DeepMind还试验了一种基于谷歌Gemini和DeepMind最新研究的自然语言推理系统,以实现高级问题解决技能。

有了该系统后,不仅不用把问题翻译为形式语言,而且它还能够和其他人工智能系统结合使用。DeepMind还在今年的IMO问题上测试了这种方法,结果显示出巨大的潜力。

“我们的团队正在继续探索多种用于推进数学推理的人工智能方法,并计划很快发布有关AlphaProof的更多技术细节。”DeepMind在博客中写道。

可以预见的是,随着技术的不断进步,我们将会看到更多令人兴奋的人类+人工智能协作,推动数学和人工智能领域的共同发展。

THE END
1.AI答题胜过真人—论文—科学网近日一项发表于《公共科学图书馆-综合》的研究发现94%的使用ChatGPT创建的大学考试答案,不会被检测出是由人工智能(AI)生成的,而且这些答案的得分往往比真实学生的更高。 如今,人工智能(AI)技术的兴起和发展,如ChatGPT的诞生,对教育部门提出了一个根本性问题,即学校许多形式的评估,都是在没有监考的情况下完成的,https://news.sciencenet.cn/htmlpaper/2024/6/2024627171052929106073.shtm
2.智能AI答题助手BIM免费教程智能AI答题助手是一种利用人工智能技术来帮助用户解答问题的工具。它可以通过分析问题并搜索相关信息,快速给出准确的答案,为用户节省时间和精力。 人工智能技术 智能AI答题助手采用了先进的人工智能技术,包括自然语言处理、机器学习和数据挖掘等。这些技术使得答题助手能够理解用户提出的问题,并从海量的信息中找到正确的答案http://www.tuituisoft.com/ai/126680.html
3.《人工智能导论》考试必备简答题重点.pdf《人工智能导论》是深入理解和掌握人工智能核心概念与技术的重要教材。这门学科的起源可以追溯到1956年,由斯坦福大学教授约翰·麦卡锡在一次学术会议上首次提出“人工智能”这一概念,标志着AI作为一个独立学科的诞生。人工智能的目标在于使机器能够展现出与人类相似的智能行为,这涵盖了模拟人类的感知、学习和认知能力。 在https://download.csdn.net/download/weixin_44939369/57063218
4.AI智能答题系统开发游戏开发一对一郑州深圳答题接口设计:为答题系统设计api接口,将模型与其他应用程序集成。 用户界面设计:为用户提供良好的交互体验,包括ui设计、提示信息、反馈等。 调试和优化:对系统进行测试和调试,并不断优化算法和性能。 上线部署:将答题系统部署到云端或者自有服务器上,并提供用户访问入口。 ai智能答题系统的开发需要注重数据采集和处理、https://m.11467.com/product/d19221963.htm
5.财经分析国资央企持续发力人工智能产业如何更好推动产业发展新华财经北京9月13日电(记者沈寅飞、许坦)数字人、AI健身陪练、智能助手……在2024年中国国际服务贸易交易会上,中国移动、中国电信等多家中央企业展出的人工智能产品引起了广泛关注。随着科技的飞速发展,人工智能已逐渐成为推动产业转型升级、提高生产效率、优化服务质量的重要力量。现实生活和工作中,国资央企作为国家经https://wap.eastmoney.com/a/202409133183330094.html
6.AI大战高考作文:瞎编凑字数万能套路AI大模型就像工业流水线,批量生产作文。但本质上,无论它说出来的话多么像人话,驱动的技术都是数学和统计,而非意识。 在人工智能行业,让AI听懂人话、会说人话,一直以来都是一件很困难的事情。人类的自然语言是一个极其复杂的系统,科学家让机器模拟了人类大脑的神经网络,使其具备深度学习能力,但始终不具备跟人一http://www.bianews.com/news/details?id=150443
7.夸克AI试用体验:网盘看片之外,它竟还能做这些夸克AI 的优点显而易见,它是一款功能强大、使用便捷的 AI 应用。它在搜索、写作、翻译等方面表现出色,为用户提供了高效的智能服务。然而,在使用过程中,它也暴露出了一些不足之处。例如,在进行 AI 视频分析时,它并没有给出我们想要的中文内容。 总体来说,夸克是一款非常值得推荐的 AI 应用。随着人工智能技术的https://www.myzaker.com/article/6708d03b8e9f09199b168147
8.人工智能期末考试(刷题篇&部分题有答案)51CTO博客计算智能是人工智能研究的新内容,涉及神经计算、模糊计算、进化计算 不确定性推理主要有两种不确定性,即关于结论的不确定性和关于证据的不确定性 简答题及计算题 什么是产生式?产生式规则的语义是什么? 答:产生式规则基本形式:P->Q 或者 IF P THEN Q https://blog.51cto.com/u_13946099/8087357
9.关于人工智能与教育之间的关系,以下哪种表述符合目前现状?()(一)中国和德国是《华盛顿公约》和《汉城公约》的缔约国。中国某企业与德国企业柏林省水厂签订合资合同,在上海兴建上海污水处理有限公司。根据合资合同规定,上海污水处理有限公司的投资总额为1200万美元,其中注册资本为1000万美元。该公司的投资总额所需的其余200万美元资金通过项目贷款来解决。问题:(1)如果投资者https://www.shuashuati.com/ti/cb1e13893bd4474ba050d3d93489e559.html
10.万能小inAI智能写作系统只需要一键,万能小in就能帮你轻松完成~还可以一键创作魔法头像、AI答题、简历、营销文案、工作总结、研究报告、读书笔记。网站提供:Ai工具箱,Ai写作对话,AI写作,万能小in,ai智能写作,AI创作,智能写作生成器,智能对话助手,大语言模型,人工智能,一键写作,办公工具,写文章,文章格式,毕业答辩,读书笔记,写简历,参考文献https://openi.cn/sites/112763.html
11.挑战答题助手ai搜题下载手机版2024最新免费安装挑战答题助手ai搜题,一般又称挑战答题助手。 挑战答题助手app是一款支持多种答题游戏的答题辅助应用,挑战答题助手软件使用简单题库全面,各种答题闯关游戏都能一秒帮你挑出正确答案,挑战答题助手app助力成功闯关赢奖金。 软件介绍 挑战答题助手app是一款基于人工智能技术的全民百科知识问答辅助软件,挑战答题助手软件支持各类问https://www.liqucn.com/app-rn-150556-0