第二届人工智能数学奥林匹克竞赛正在进行,经过严格审核,阿里前几天发布的推理模型QwQ-32B受到了大赛组织的认可,被纳入了竞赛模型白名单
AIMO奖项旨在推动能够进行数学推理以解决问题的AI模型的开放发展。这一领域是知识和科学发现的新前沿,而AIMO奖项可能被视为一种新的图灵测试
AIMO奖项提出了三项初步设计原则:
1.AI模型必须以与人类参赛者相同的格式接收问题,并生成符合标准奥林匹克竞赛评分标准的、专家小组可评估的、可读性良好的解决方案
2.特等奖将授予在AIMO批准的比赛中表现达到相当于国际数学奥林匹克竞赛(IMO)金牌水平的AI模型
3.参赛者必须在奖项颁发前遵守AIMO的公共共享协议,才有资格获奖
最近进展的关键之一是一个新的白名单审批流程(SimonFrieder领导),这一流程批准了一个功能强大的新开源模型——QwQ-32B的特定实例——与之前的开源模型相比,该模型似乎在这类竞赛问题上表现更出色
目前已经有几名参赛选手的提交达到了20/50(50次提交获得20分)
白名单流程:推动竞赛创新的核心
这次竞赛的一大突破来自一种全新的“白名单审批”流程(whitelistingprocess)。在SimonFrieder的带领下,这一流程成功地批准了一个强大的开源模型——QwQ-32B的特定版本。根据测试结果,这款模型在解决竞赛中的数学问题上表现显著优于以往的开源模型。Frieder表示,这种白名单流程不仅支持社区参与,还严格遵守了开放科学的原则。
白名单审批的关键规则:
Frieder还鼓励社区对所有白名单申请进行公开讨论和反馈,确保每一个被批准的模型都经过严格的审查和验证。这种透明的参与机制不仅提高了竞赛的公平性,也为整个AI社区的技术共享树立了标杆
THE END