华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上

华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上

2023-07-07

上世纪20年代以来,特别是近三十年随着算力的迅速发展,数值天气预报在每日天气预报、极端灾害预警、气候变化预测等领域取得了巨大的成功。但是随着算力增长的趋缓和物理模型的逐渐复杂化,传统数值预报的瓶颈日益突出。研究者们开始挖掘新的气象预报范式如使用深度学习方法预测未来天气。在数值方法应用最广泛的领域如中长期预报中,现有的AI预报方法精度仍然显著低于数值预报方法,并受到可解释性欠缺,极端天气预测不准等问题的制约。

盘古气象大模型由盘古团队发布,主要完成人为毕恺峰、谢凌曦、张恒亨、陈鑫、顾晓韬以及田奇老师。

气象预报是科学计算领域最重要的场景之一,对未来天气变化的预测特别是对极端天气如暴雨、台风、干旱、寒潮的预测至关重要。传统数值预报使用数学物理方程建模大气状态并使用计算机仿真方法求解方程得到未来天气状态,在过去三十年取得了令人瞩目的成功。但是,随着算力增长的趋缓和物理模型的日益复杂,数值气象预报方法也逐渐遇到了瓶颈:一方面,传统数值预报对算力的消耗非常大,如0.25^\circ\times0.25^\circ精度的未来10天数值预报,需在超过3000个节点的超级计算机上花费数小时进行仿真;另一方面,复杂的参数化物理模型始终是不完备的,对物理过程的参数化,不可避免地向数值预报引入系统误差。

盘古气象大模型首次在中长期气象预报上超过了传统数值方法。训练和测试均在ERA5数据集上进行,其包括43年(1979-2021年)的全球实况气象数据。其中,1979-2017年数据作为训练集,2019年数据作为验证集,2018、2020、2021年数据作为测试集。盘古大模型使用的数据,包括垂直高度上13个不同气压层,每层五种气象要素(温度、湿度、位势、经度和纬度方向的风速),以及地球表面的四种气象要素(2米温度、经度和纬度方向的10米风速、海平面气压)。图1展示了盘古气象大模型的一些结果。我们可以看到,盘古气象大模型全方位地超过了现有的数值预报方法(欧洲气象中心的operationalIFS)。例如,盘古气象大模型提供的Z500五天预报均方根误差为296.7,显著低于之前最好的数值预报方法(operationalIFS:333.7)和AI方法(FourCastNet:462.5)。同时,盘古气象大模型在一张V100显卡上只需要1.4秒就能完成24小时的全球气象预报,相比传统数值预报提速10000倍以上。

盘古气象大模型的思路十分明确:气象数据和图像数据具有很多相似之处,能否利用当前CV领域的大模型,对于气象数据进行分析?在前人工作(如英伟达的FourCastNet)的基础上,盘古研究团队发现:AI气象预报模型的精度不足,主要有两个原因。第一,现有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据。第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。为此,本文提出了3DEarth-SpecificTransformer(3DEST)来处理复杂的不均匀3D气象数据,并且使用层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。

中长期气象预报需要多次迭代模型得到预报结果。例如,FourCastNet需要调用6小时预测间隔的AI模型共计28次,以得到7天的预测结果。由于缺少数学物理机理约束,AI模型的迭代误差随着迭代次数的增加而迅速上升。如图4所示,把盘古气象预报的6小时模型迭代了28次得到的7天预报结果,精度明显低于24小时模型迭代7次的预报结果;而如果使用1小时模型迭代168次,预报误差则呈现超线性上升趋势。

【算力消耗】为了训练每个模型,研究人员使用1979-2021年的气象数据,以小时为单位采样,训练了100个epoch。每个模型需要在192块V100显卡上训练16天。事实上,即使经历100个epoch,这些模型依旧没有完全收敛。也就是说,在计算资源更加充足的情况下,AI预报的精度还能够进一步提升。推理时,盘古气象大模型仅需在一张V100显卡上运行1.4秒,即可完成24小时全球气象预报。相比传统数值预报,计算速度的提升超过10000倍。

【可视化】如图1和图6所示,盘古气象大模型可以很好地预测细粒度气象特征。同时,在可视化中可以观察到,AI预报的结果通常更加平滑,而数值预报则更经常地预测出一些不存在的特征。这反映出AI气象预报和传统气象预报间存在差异性和互补性。

【诊断实验】本文提供两个诊断实验。

【总体极端天气预测趋势】与FourCastNet一样,盘古气象大模型计算了RQE值来衡量不同预报方法的极端天气预测趋势(具体数学定义参见论文)。RQE值小于0表示模型倾向于低估极端天气影响,RQE值大于0表示模型倾向于高估极端天气影响,RQE值接近0表示模型预报更准确。从图8中可以看出,AI方法和数值方法都倾向于低估极端天气影响。盘古气象大模型在Q500上表现的比operationalIFS强(低估得更少),在U500上表现的比operationalIFS弱(低估得更多),在U10上一开始表现的比operational强,最后表现的比operationalIFS略弱。得益于高效的层次化时域聚合算法,盘古气象大模型在U10上的RQE结果明显高于FourCastNet(低估得更少),这也对应于盘古气象大模型在确定性预报上精度更高的事实。

最后,本文还探索了使用盘古气象大模型进行集成预报的简单方法。研究人员向模型的输入中加入随机珀林噪声,得到99组输入扰动的预报和1组输入未扰动的预报。如图11所示,简单的输入扰动形成的集成预报,其短期(<2天)预报精度略低于未经扰动的确定性预报,而其长期(>5天)预报精度明显高于未经扰动的确定性预报。例如,集成预报的平均值把Z500和U10的7天预测均方根误差从500.3和3.48降低至450.6和2.96,相对下降达到10%和15%以上。结合气象知识使用相似的方法可以得到更加有效的集成预报,例如使用奇异向量法扰动盘古气象大模型的输入。受限于作者有限的气象知识,研究人员期待,在经验更丰富的气象专家介入之后,盘古气象大模型的集成预报效果能够得到进一步的提升。

本文介绍了一个基于人工智能的数值天气预报系统:盘古气象大模型。本文的主要技术贡献包括(i)设计3DEarth-Specific(3DEST)网络结构和(ii)应用层次化时域聚合策略。通过在39年的全球天气数据上训练深度神经网络,盘古气象大模型首次在精度和速度方面超越了传统的NWP方法。盘古气象大模型具有极高的预报速度,为气象学家将他们的知识整合到基于人工智能方法中提供了便利。

1.关于“AI方法能够超过传统NWP方法”的论断

2.再分析数据也许不能实时获得,因而此类AI算法可能不实用

3.为什么我们坚信AI方法一定是气象预报的未来趋势

4.AI方法是否会取代传统方法?

AI进入任何一个领域时,都会有类似的声音和担忧。举例说,AI与医学影像分析已经结合了10年以上,至今AI方法还是起到辅助作用,无法替代医生,特别是高水平专家。在气象领域也是一样:盘古虽然在全球预报上超越了传统方法,但是它也存在一些弊病,例如总是低估台风强度(路径准确、中心气压预估偏高),又例如可解释性不足。因此,我们的结论是明显的。第一,AI在量化评测上超过传统方法,已是不争的事实。第二,AI方法短期内无法彻底取代传统方法,两者需要深度融合。我呼吁气象学家们与AI领域深度合作,共同探索这一激动人心的新方向。

THE END
1.福彩3d走势分析方法大全彩民可以通过3D彩票历史开奖数据手动计算出重号出现的概率,从而预测下一期的出号情况。 4.跨度分析法: 跨度指的是开奖号码中的最大号码与最小号码的差值,通过跟踪和分析3D彩票的历史开奖数据,彩民可以发现跨度的走势规律,得出跨度的常出数字,从而预计下一期开奖的跨度。https://res.17500.cn/arts/sdetail-10118236.html
2.抖音热点3d数据分析怎么做?在数据大屏上实现不难!3d数据分析3d开机号近100期_3d最近100期开机号_福彩3d开机号近100期_|3d开机号,王者超级触控下载-王者超级触控免费版下载9.1_5577安卓网|王者,下载,科普|“zztt42.ccm黑料不打烊”-快科技-\-科技改变未来|黑料不打烊,独家视频丨66m66成长模式视频 - 威九国际_世界就在眼前66m|66m66成长模式视频,威九国际,上课勃起http://m.ruhrg.com/v/video/483449_20241128.shtml
3.CTF实战数据包解题及思路数据包分析题在CTF中基本是必考题目,这类题目一般是给出一个pcap包文件,要求从中分析出Flag。 1.数据包解题方法及思路 数据包分析题在CTF中基本是必考题目,这类题目一般是给出一个pcap包文件,要求从中分析出Flag。有的简单,直接通过字符串检索就可以获取,有点需要破解密码,有的需要保存文件,虽然样式很多,但仍然有https://www.51cto.com/article/790160.html
4.JELLY写给大家看的数据分析思路(二)·分析方法在上一篇文章[写给大家看的数据分析思路(一)]中,着重介绍了数据分析6步的的前3步:构建X问题、提出假设&选择指标、数据采集与整理,这3步如果没有足够的数据处理经验,可能会耗费整个数据分析60%-70%的时间,但下面一个环节--数据分析,虽然耗时不如准备阶段那么多,却是所有环节中专业门槛最高、含金量最高的环节。https://jelly.jd.com/article/5e4b5afb01a3a70183dfa877
5.3d数据分析3D数据分析是一种新兴的技术,它能够将数据以3D形式呈现,使得数据更加直观、立体。通过3D数据分析,我们可以更好地理解和分析大量的数据,从而提高决策的准确性。本文将介绍3D数据分析的基本概念、应用场景、实现方式,以及它所带来的优势和挑战。https://aiqicha.baidu.com/qifuknowledge/detail?id=10058195794
6.2023年山东大众报业(集团)有限公司权属单位招聘岗位表2.具备财经类新闻新作能力,有敏锐的市场洞察力,有经营思路,具备策划、执行活动的能力,有良好的沟通能力及服务意识。 1 北京市 商务经理 负责客户渠道拓展和销售工作。 1.全日制本科及以上学历; 2.熟悉新闻类APP已有平台运营、数据分析、策略调整等,能够总结最佳广告变现投放方式; 3.具备客户信息收集、商务资源开拓、http://www.sdsgwy.com/article/html/5471952.html
7.tabby静态分析实践代码属性图生成阶段:如何抽象代码、如何分析代码的执行、如何设计图结构等等,这些设计细节、实现细节可以暂时不管,但要知道该阶段结束时生成的代码属性图是什么结构。查找代码属性图阶段:先了解 Neo4j 图数据库再看。1b 安装和运行参考文章 Neo4j 环境配置 V5,访问官网下载 dmg 安装包并自动下载 Neo4j 5.12.0,分别https://xz.aliyun.com/t/13233
8.全球碳盘点卫星遥感监测方法进展与挑战2019年第49届IPCC全会明确增加了基于卫星遥感的排放清单校验方法。欧盟、美国、日本、加拿大等正在大力发展温室气体排放的MVS(Monitoring and Verification Support)能力。本文调研分析了全球碳盘点对卫星遥感技术的需求,介绍了全球碳盘点卫星遥感的技术原理,梳理了温室气体卫星遥感、生态系统碳源汇卫星遥感估算、人为源碳排放http://www.jors.cn/jrs/article/html/202202001
9.许嘉宾–西安图谱云端信息技术有限公司申请方法如下:进入Jiabin Science Laboratory (嘉宾科学实验室)官方网站,点击“全球招募”,下载申请表格,根据申请要求完成申请。 五、医学、生物、机械设计和制造、统计学计算和分析软件 (1)3D Printing CAM数据整理软件:WPS-Excel、Microsoft Word-Excel、PPT、PDF https://www.mapsciencecloud.com/author/adminxujiabin
10.2D数据如何做出3D成果?基于GIS的空间分析与可视化展示丨城市数据派那么,如何才能用二维的数据做出三维的效果呢? arcscene的非典型用法 arcscene是美国esri公司开发的arcgis软件桌面系统3d分析扩展模块中的一部分,是一个适合于展示三维透视场景的平台,可以在三维场景中漫游并与三维矢量和栅格数据进行交互,比较https://mp.weixin.qq.com/s?__biz=MzA3OTU3ODgxNA==&mid=2650633612&idx=1&sn=c9b5c0945bf89ad74bd70d0de2df2152&chksm=87b8865db0cf0f4b9dac147e3dc17076a0a3267a5e528e39d2e4ede3ef5d46e94ea9df1076c1&scene=27
11.2022爱分析?人工智能应用实践报告在本报告中,爱分析基于大量调研和过往研究积累,从战略、数据、场景规划、应用解决方案开发、技术基础设施、组织和人才六个维度梳理出了目前人工智能在产业中落地面临的20个主要挑战。 评估AI应用成熟度,因地制宜推进智能化 智能化转型没有统一的路径和方法,不同企业在不同阶段面临的问题通常也各不相同。因此,企业在https://tech.china.com/article/20220302/032022_1021065.html
12.wechatspider3.3.1 anyroxy代码及思路讲解打开\node-v6.11.0-win-x64_wechat\node_modules\anyproxy\lib\rule_default.js 查看replaceServerResDataAsync方法,通过该方法,可以劫持服务端到客户端的数据,处理入库,然后篡改数据再给客户端。代码如下: replaceServerResDataAsync: function(req,res,serverResData,callback){ thttps://github.com/tigercm/wechat-spider-1/blob/b50fd735f41c05955101bbb92f4429620f7b1069/README.md
13.科学网—车辆再识别技术综述第3节对现有的车辆再识别研究进行分类,对传统的车辆再识别方法进行简短地总结与回顾,从解决问题的着手点出发,详细地介绍基于深度学习的车辆再识别方法。第 4 节介绍具有代表性的车辆再识别数据集,并对取得优异性能的方法进行比较和分析。第 5 节对车辆再识别技术面临的挑战和研究趋势进行总结和展望。https://blog.sciencenet.cn/blog-951291-1232372.html