日前,首届人工智能数学奥林匹克进步奖竞赛(AIMOProgressPrize)现已启动,这是由两位菲尔兹奖得主(TimothyGowers蒂莫西·高尔斯、TerenceTao陶哲轩)及Po-ShenLoh(罗博深)、DanRoberts(丹·罗伯茨)、GeoffSmith(杰夫·史密斯)担任顾问委员会,伦敦金融科技公司XTXMarkets赞助的千万美元AI奥数奖(AI-MOPrize)的第一部分,用于奖励答对题库(公开和非公开题库各50道题,高中水平)开源的AI“做题家”(代码需公开开源),奖金池$22;=$1048576美金。
这项比赛的目标是创建一些算法和模型,可以解决以LaTeX格式编写的棘手的数学问题。广泛的参与将有助于提高AI模型的数学推理技能并推动前沿知识。注意,该比赛相当于与今年IMO(InternationalMathematicalOlympiad国际奥数,第65届竞赛于2024年7月在英国巴斯市举办)同期进行的$500万大奖赛(TheGrandPrize)之前的“开胃菜”。(参阅)
关于比赛日期
首届AIMO(人工智能奥数竞赛)第一阶段进步奖比赛:
2024-4-1~2024-6-27
4月1日:开始日期
6月20日:报名截止日期。这也是参与者可以加入或合并团队的最后一天
6月27日:最终提交截止日期
第65届IMO(国际奥林匹克数学竞赛),供对比参考:
2024-7-11~2024-7-22
7月15日:开幕式
7月16日:比赛第一天考试(8:30-13:00)
7月17日:比赛第二天考试(8:30-13:00)
7月21日:闭幕式(16:00)和告别晚会(19:00)
关于AIMO进步奖奖金
奖金分为两部分:
1、最佳团队奖的奖金
第一名:$131072=21;
第二名:$65536=21;
第三名:$32768=21;
第四名:$16384=21;
第五名:$8192=21;3;
若五支排名最高的队伍中的任何一支在公开和私人测试集上都没有超过Gemma7B的基准(3/50),则该队伍的奖金将除以4。
2、整体进步奖的奖金
整体进步奖获得者应是在公开和非公开测试集上得分至少为47/50的最高排名团队。在五个最高排名的团队获得任何奖项后,总资金的剩余部分将授予整体进步奖得主,即奖金至少为22;-(21;+21;+21;+21;+21;3;)=$794624美金。如果没有团队在本次比赛中获得整体进步奖,则总资金的剩余部分将转入下一次比赛,届时将同样用于奖金分配。
关于参赛规范要求
参赛作品必须通过笔记本电脑提交。为了在代码上传后激活“提交”按钮,必须满足以下条件:
互联网接入禁用
允许自由和公开的外部数据,包括预训练模型
提交文件必须命名为submission.csv
关于自动化机器学习工具(AMLT)和预训练模型
个人参与者和团队可以使用自动化机器学习工具(“AMLT”)(例如,GoogleAutoML、H2O无人驾驶AI等)创建提交,前提是参赛者或团队确保他们拥有AMLT的适当许可,以便能够遵守竞争规则。团队只能使用开源且在2024年2月23日之前发布的AI模型和工具。例如,编程语言,如Python和Lean,以及具有公开可用权重的LLMs,如Llama或Gemma。
关于数据集
竞赛数据包括110个与AIME(AmericanInvitationalMathematicsExamination美国数学邀请赛,是介于美国数学竞赛AMC10、AMC12及美国数学奥林匹克竞赛USAMO之间的一个数学竞赛)风格相似的数学问题。所有问题都是纯文本的,并使用LaTeX中的数学符号,虽然有些问题可能涉及几何学,但在任何问题中都不使用图表。每个问题的答案都是一个非负整数,模型预测答案时,对答案数字取模1000,即提交0~999之间的数字。例如,如果你认为问题的答案是2034,那么你的预测应该是34。
问题总数:110=50+50+10
其中公共测试集有50个问题,非公开测试集有50个问题,训练数据集有10个问题。
满足((|x+y|-10)2;+(|x-y|-10)2;)((|x|-8)2;+(|y|-8)2;)=0的点(x,y)围成一个凸多边形。这个凸多边形的面积是多少?
有多少个正整数m,使得方程[||x-1|-2|=m/100]有4个整数解?
存在一个唯一的递增几何级数,由五个两位正整数组成。该数列的和是多少?
函数f:→,满足对于所有正整数n,f(f(f(n)))=8n-7且f(2n)=2f(n)+1。计算f(100)。
对正整数n进行“闪光”(sparkle)运算,即计算n的数字之和并取其阶乘,例如13的闪光是4!=24。一个机器人从黑板上一个正整数开始,然后在接下来的每一秒,用它的“闪光”替换黑板上的数字。对于一些“特殊”数字,如果它们是第一个数字,那么最终出现的每个数字都会小于6。有多少这样的特殊数字,满足最多为36位数?
当x和y在所有实数范围内变化,且|x-2y|+|y-2x|=40时,5x2;+5y2;-8xy的最小值是多少?
设k,l>0为参数。抛物线y=kx2;-2kx+l与直线y=4相交于两点A和B。这些点之间的距离是6。求从原点分别到A点和B点的距离之和的平方。
设ABCD是一个单位正方形。设P为AB上的一点,满足|AP|=1/20,设Q为AD上的一点,满足|AQ|=1/24。线段DP和BQ将正方形分为四个区域。求最大区域与最小区域的面积比。
假设我们掷4个六面公平骰子,面分别标有1到6。设a/b为最高掷出5的概率,其中a和b是互质的正整数。求a+b。
从111到999的每个三位数被染成蓝色或黄色,使得任意两个(不必不同)黄色数字的和等于一个蓝色数字。黄色数字的最大可能个数是多少?