华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上

华为云提出盘古气象大模型:中长期气象预报精度首次超过传统数值方法,速度提升10000倍以上

2023-07-07

上世纪20年代以来,特别是近三十年随着算力的迅速发展,数值天气预报在每日天气预报、极端灾害预警、气候变化预测等领域取得了巨大的成功。但是随着算力增长的趋缓和物理模型的逐渐复杂化,传统数值预报的瓶颈日益突出。研究者们开始挖掘新的气象预报范式如使用深度学习方法预测未来天气。在数值方法应用最广泛的领域如中长期预报中,现有的AI预报方法精度仍然显著低于数值预报方法,并受到可解释性欠缺,极端天气预测不准等问题的制约。

盘古气象大模型由盘古团队发布,主要完成人为毕恺峰、谢凌曦、张恒亨、陈鑫、顾晓韬以及田奇老师。

气象预报是科学计算领域最重要的场景之一,对未来天气变化的预测特别是对极端天气如暴雨、台风、干旱、寒潮的预测至关重要。传统数值预报使用数学物理方程建模大气状态并使用计算机仿真方法求解方程得到未来天气状态,在过去三十年取得了令人瞩目的成功。但是,随着算力增长的趋缓和物理模型的日益复杂,数值气象预报方法也逐渐遇到了瓶颈:一方面,传统数值预报对算力的消耗非常大,如0.25^\circ\times0.25^\circ精度的未来10天数值预报,需在超过3000个节点的超级计算机上花费数小时进行仿真;另一方面,复杂的参数化物理模型始终是不完备的,对物理过程的参数化,不可避免地向数值预报引入系统误差。

盘古气象大模型首次在中长期气象预报上超过了传统数值方法。训练和测试均在ERA5数据集上进行,其包括43年(1979-2021年)的全球实况气象数据。其中,1979-2017年数据作为训练集,2019年数据作为验证集,2018、2020、2021年数据作为测试集。盘古大模型使用的数据,包括垂直高度上13个不同气压层,每层五种气象要素(温度、湿度、位势、经度和纬度方向的风速),以及地球表面的四种气象要素(2米温度、经度和纬度方向的10米风速、海平面气压)。图1展示了盘古气象大模型的一些结果。我们可以看到,盘古气象大模型全方位地超过了现有的数值预报方法(欧洲气象中心的operationalIFS)。例如,盘古气象大模型提供的Z500五天预报均方根误差为296.7,显著低于之前最好的数值预报方法(operationalIFS:333.7)和AI方法(FourCastNet:462.5)。同时,盘古气象大模型在一张V100显卡上只需要1.4秒就能完成24小时的全球气象预报,相比传统数值预报提速10000倍以上。

盘古气象大模型的思路十分明确:气象数据和图像数据具有很多相似之处,能否利用当前CV领域的大模型,对于气象数据进行分析?在前人工作(如英伟达的FourCastNet)的基础上,盘古研究团队发现:AI气象预报模型的精度不足,主要有两个原因。第一,现有的AI气象预报模型都是基于2D神经网络,无法很好地处理不均匀的3D气象数据。第二,AI方法缺少数学物理机理约束,因此在迭代的过程中会不断积累迭代误差。为此,本文提出了3DEarth-SpecificTransformer(3DEST)来处理复杂的不均匀3D气象数据,并且使用层次化时域聚合策略来减少预报迭代次数,从而减少迭代误差。

中长期气象预报需要多次迭代模型得到预报结果。例如,FourCastNet需要调用6小时预测间隔的AI模型共计28次,以得到7天的预测结果。由于缺少数学物理机理约束,AI模型的迭代误差随着迭代次数的增加而迅速上升。如图4所示,把盘古气象预报的6小时模型迭代了28次得到的7天预报结果,精度明显低于24小时模型迭代7次的预报结果;而如果使用1小时模型迭代168次,预报误差则呈现超线性上升趋势。

【算力消耗】为了训练每个模型,研究人员使用1979-2021年的气象数据,以小时为单位采样,训练了100个epoch。每个模型需要在192块V100显卡上训练16天。事实上,即使经历100个epoch,这些模型依旧没有完全收敛。也就是说,在计算资源更加充足的情况下,AI预报的精度还能够进一步提升。推理时,盘古气象大模型仅需在一张V100显卡上运行1.4秒,即可完成24小时全球气象预报。相比传统数值预报,计算速度的提升超过10000倍。

【可视化】如图1和图6所示,盘古气象大模型可以很好地预测细粒度气象特征。同时,在可视化中可以观察到,AI预报的结果通常更加平滑,而数值预报则更经常地预测出一些不存在的特征。这反映出AI气象预报和传统气象预报间存在差异性和互补性。

【诊断实验】本文提供两个诊断实验。

【总体极端天气预测趋势】与FourCastNet一样,盘古气象大模型计算了RQE值来衡量不同预报方法的极端天气预测趋势(具体数学定义参见论文)。RQE值小于0表示模型倾向于低估极端天气影响,RQE值大于0表示模型倾向于高估极端天气影响,RQE值接近0表示模型预报更准确。从图8中可以看出,AI方法和数值方法都倾向于低估极端天气影响。盘古气象大模型在Q500上表现的比operationalIFS强(低估得更少),在U500上表现的比operationalIFS弱(低估得更多),在U10上一开始表现的比operational强,最后表现的比operationalIFS略弱。得益于高效的层次化时域聚合算法,盘古气象大模型在U10上的RQE结果明显高于FourCastNet(低估得更少),这也对应于盘古气象大模型在确定性预报上精度更高的事实。

最后,本文还探索了使用盘古气象大模型进行集成预报的简单方法。研究人员向模型的输入中加入随机珀林噪声,得到99组输入扰动的预报和1组输入未扰动的预报。如图11所示,简单的输入扰动形成的集成预报,其短期(<2天)预报精度略低于未经扰动的确定性预报,而其长期(>5天)预报精度明显高于未经扰动的确定性预报。例如,集成预报的平均值把Z500和U10的7天预测均方根误差从500.3和3.48降低至450.6和2.96,相对下降达到10%和15%以上。结合气象知识使用相似的方法可以得到更加有效的集成预报,例如使用奇异向量法扰动盘古气象大模型的输入。受限于作者有限的气象知识,研究人员期待,在经验更丰富的气象专家介入之后,盘古气象大模型的集成预报效果能够得到进一步的提升。

本文介绍了一个基于人工智能的数值天气预报系统:盘古气象大模型。本文的主要技术贡献包括(i)设计3DEarth-Specific(3DEST)网络结构和(ii)应用层次化时域聚合策略。通过在39年的全球天气数据上训练深度神经网络,盘古气象大模型首次在精度和速度方面超越了传统的NWP方法。盘古气象大模型具有极高的预报速度,为气象学家将他们的知识整合到基于人工智能方法中提供了便利。

1.关于“AI方法能够超过传统NWP方法”的论断

2.再分析数据也许不能实时获得,因而此类AI算法可能不实用

3.为什么我们坚信AI方法一定是气象预报的未来趋势

4.AI方法是否会取代传统方法?

AI进入任何一个领域时,都会有类似的声音和担忧。举例说,AI与医学影像分析已经结合了10年以上,至今AI方法还是起到辅助作用,无法替代医生,特别是高水平专家。在气象领域也是一样:盘古虽然在全球预报上超越了传统方法,但是它也存在一些弊病,例如总是低估台风强度(路径准确、中心气压预估偏高),又例如可解释性不足。因此,我们的结论是明显的。第一,AI在量化评测上超过传统方法,已是不争的事实。第二,AI方法短期内无法彻底取代传统方法,两者需要深度融合。我呼吁气象学家们与AI领域深度合作,共同探索这一激动人心的新方向。

THE END
1.教你如何看懂3D走势图3D 彩票以其独特的魅力吸引着众多彩民参与其中,而看懂 3D 走势图则是许多彩民试图掌握的关键技能,它能为选号提供一定的参考依据,尽管并不能确保中奖,但有助于我们更深入地了解号码的走势规律。 首先,我们要明确 3D 走势图主要展示了开奖号码在不同期数下各个数位(百位、十位、个位)上数字的变化情况。通常,走势图https://www.17500.cn/arts/sdetail-11220108.html
2.3d定位杀码计算公式期数主界面分析法大乐透期如果你还在为不知道怎么玩 3D 而烦恼的话,那么这条视频你一定要看完。 第一种就是历史数据分析法。我们先看下期数,然后选择一个开奖号码,点击该号码,就会弹出这个窗口,这里就可以看到从 021 开始到本期的各个号码的历史走势情况,通过对比可以发现哪些号码是常出现的,哪些号码是很少出现的,从而选出自己中意的号码https://www.163.com/dy/article/JIDO2JIR0556AN1V.html
3.福彩3d走势图数据分析一、福彩3D走势图数据分析的重要性福彩3D作为一种流行的彩票游戏,吸引了众多玩家。然而,如何提高中奖概率一直是彩民们关注的问题。通过对福彩3D走势图进行数据分析,可以帮助彩民更好地理解彩票的规律,优化投注策略,从而增加赢奖的可能性。二、福彩3D走势图数据分析方法1. 观察号码分布:分析近期的开奖号码,了解号码的分https://aiqicha.baidu.com/qifuknowledge/detail?id=10860598517
4.3d怎么看走势图和分析数据帆软数字化转型知识库预测号码:根据数据分析和规律发现的结果,结合个人经验,预测下一期可能出现的号码组合。 验证结果:在下一期的开奖结果中,验证预测结果的准确性,并根据结果调整下一步的分析策略。 通过这种实际操作,可以更好地掌握3D走势图和数据分析的方法和技巧,提高预测的准确性。 https://www.fanruan.com/blog/article/455650/
5.抖音热点3d数据分析怎么做?在数据大屏上实现不难!3d数据分析3d开机号近100期_3d最近100期开机号_福彩3d开机号近100期_|3d开机号,王者超级触控下载-王者超级触控免费版下载9.1_5577安卓网|王者,下载,科普|“zztt42.ccm黑料不打烊”-快科技-\-科技改变未来|黑料不打烊,独家视频丨66m66成长模式视频 - 威九国际_世界就在眼前66m|66m66成长模式视频,威九国际,上课勃起http://m.ruhrg.com/v/video/483449_20241128.shtml
6.以下说法正确的是()。A数据分析是指用适当的统计分析方法对收集来以下说法正确的是()。 A、数据分析是指用适当的统计分析方法对收集来的大量数据进行分析 B、数据分析追求最大化地开发数据的功能,发挥数据的作用。 C、数据分析师为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。 D、数据分析中的数据一般也成观测值,是通过实验、测量、观察、调查等方式获取的结http://www.ppkao.com/wangke/daan/d19a3dd5b7b645519ec0969b873d54e5
7.线性回归rcs非线性分析方法线性回归非线性线性回归rcs非线性分析方法 线性回归 非线性 一元线性回归 回归分析用来建立方程模拟两个或者多个变量之间如何关联 一元线性回归包括一个自变量和一个因变量 如果包含两个以上的自变量,则称为多元线性回归 代价函数(损失函数) 损失函数的最终目的是为了使得误差平方和最小https://blog.51cto.com/u_16099205/11073381
8.机器学习数据清洗之识别异常点数据是现代社会中的一种宝贵资源,但在利用数据之前,我们需要进行数据清洗以确保数据的质量和准确性。 异常值是数据中常见的问题之一,它们可能会对分析和建模产生负面影响,因此识别和处理异常值是数据清洗过程中的重要步骤之一。 本文将介绍异常值的概念、危害以及与缺失值的比较,并探讨了多种识别异常值的方法,包括基于https://www.jianshu.com/p/6676be6cdae4
9.不会错的3DCAD的选择方法是什么?管理没有正确地进行修订 零件图的修订和装配图的修订不匹配。 沿用源因人而异 因沿用源的修改而无法向沿用目标扩展 2D CAD 中看不到详细的装配状态 使用2D CAD 数据,客户无法理解 销售难以使用 3D CAD的使用问题 在这些问题中,作为工具单纯地从2D CAD切换到3D CAD,并不能解决问题。工作流程、管理方法、系统中有无https://techinfo.misumi.com.cn/exportarticle/article/3205/
10.2021届计算机科学方向毕业设计(论文)阶段性汇报基于多模态机器学习的生存风险预测方法研究 本次阶段性汇报介绍针对不同模态的肺腺癌临床数据,包括临床信息以及用药情况(文本矩阵),svs格式的病理图像,基因组序列数据(矩阵)提取对应特征,将提取的特征输入stacked bimodal autoencoder生成联合表示,以及基于上述联合表示提升传统生存分析模型(比如cox)的性能。 陈竞潇 基https://zhiyuan.sjtu.edu.cn/html/zhiyuan/announcement_view.php?id=3943
11.python数据分析与挖局书籍openintrostatistics中文版python 数据分析与挖局书籍 之前一直有朋友叫我列一个数据科学的书单,说实话这件事情我是犹豫了很久的。有两个原因,其一是因为自己读书太少才疏学浅,其二我觉得基于我个人观点认为“好”的书其实可能对于很多人是不一定合适的。 不过,明天正好是世界读书日,所以这里从一个(在读的统计PhD学生?即将去旧金山的某https://blog.csdn.net/guangyinglanshan/article/details/77775837
12.Rust语言2022年度回顾:开源生态发展语言&开发张汉东数据库与数据分析 网络服务 Web 开发 云原生 游戏 工具 图形渲染和处理 UI 游戏 人工智能 物联网与嵌入式 编程语言 本文分类梳理的开源项目,只是选举 Rust 生态中各个领域具有代表性和有潜力的项目,以此来观察 Rust 生态的发展。实际上,在撰写本文时,crates.io 上发布的 crate 数量已经达到了 10 万个,在 GitHuhttps://www.infoq.cn/article/hioW21XT8opvbip3hs5F
13.智能三相电能质量分析仪性能特点公司动态智能三相电能质量分析仪性能特点 1.3 技术规格 1.3.1 基准条件和工作条件 1.3.2 一般规格 1.3.3 精度描述(不包括电流传感器) 下面的数据是在基准条件下和在理想的电流传感器(*线性并且没有相位移)基础上的来分别介绍。 1.3.4 电流钳特性 注意:电流钳与仪表必须对应连接,不能插反,电流钳同名端方向入下: https://www.chem17.com/st299218/news_881715.html
14.第七感福彩3d软件工作原理是怎样的第七感福彩3d软件是一款用于预测和分析福彩3d的软件。它的工作原理主要基于数据分析和统计学方法。以下是其工作原理的简要介绍: 一、详细功能: 1、数据收集:该软件收集了大量福彩3d历史数据,包括期数、历史号码等信息。 2、数据分析:通过对福彩3d历史数据进行分析,找出其中的规律和趋势。这可能包括数字的频率、跨度、http://www.d7gan.com/News/view/index417.html
15.Fusingpointcloudwithimageforobjectdetectionusing设计了基于融合特征的目标检测网络,提高了不同光照条件下检测的鲁棒性;2) 采用滑动窗处理控制网络输入,平衡检测与数据采集时间,有效提升小目标的检测精度;3) 实现了对目标的精确检测及获取目标深度信息的多任务网络;4) 使用KITTI数据集进行实验评估,与多种检测算法的对比分析表明,本文方法具有检测精度和检测速度的综合https://www.oejournal.org/article/doi/10.12086/oee.2021.200418
16.科学网—车辆再识别技术综述随着深度神经网络的兴起和大型数据集的提出,提升车辆再识别的准确度成为近年来计算机视觉和多媒体领域的研究热点。从不同角度对车辆再识别方法进行了分类,并从特征提取、方法设计和性能表现等方面对车辆再识别技术进行了概述、比较和分析,对车辆再识别技术面临的挑战及发展趋势进行了预测。https://blog.sciencenet.cn/blog-951291-1232372.html
17.澳门尾王四尾八码网址171166.C0m,方案分析管理其次,在数据清洗阶段,需要对采集到的数据进行去重、去噪、填充缺失值等处理,确保数据的准确性和完整性。然后,在数据分析阶段,可以利用统计学、机器学习等方法对数据进行挖掘和分析,发现数据之间的关联性和规律性。最后,在数据应用阶段,可以将分析结果转化为实际的业务行动,帮助企业实现目标并取得成功。 具体应用方面,http://muying.xjche365.com/dodoc/zunyi/937124.html