随着大数据、云计算、人工智能等技术的成熟和在各行各业的应用,人工智能服务器的价值凸显。
人工智能服务器是专门为人工智能培训和推理应用而设计的。大型模型对计算能力的巨大需求有望进一步促进人工智能服务器市场的增长。
根据IDC的预测,2023年人工智能服务器训练需求占41.5%,随着大型模型的应用,这一比例在2025年将降至39.2%。以GPT-4的计算结果为训练需求,进一步计算2023/2025年最高推理需求为44081/48502PFlop/s-day。
IDC预计2025年全球人工智能服务器市场规模将达到266亿美元,五年复合增长率为18.9%。
人工智能服务器行业概览
服务器一般可分为通用服务器、云计算服务器、边缘服务器、AI服务器等类型。
人工智能模型对计算能力的需求来自于训练和推理。
(1)培训环节:通过标记的数据培训复杂的神经网络模型,使其能够适应特定的功能,模型具有一定的通用性,以完成各种学习任务。该链接需要处理大量的数据,并注意绝对的计算能力。
(2)推理环节:利用培训模型和新数据推理各种结论。在神经网络模型的帮助下,利用输入的新数据一次性得出正确的结论。该环节的计算能力要求略低于培训环节,但要注意综合指标、单位能耗计算能力、延迟、成本等。
与高性能服务器和基础服务器相比,人工智能服务器在芯片组中的价格往往更高。人工智能服务器(培训)芯片组的成本占83%、AI服务器(推理)芯片组占50%,远高于通用服务器芯片组。
大型人工智能模型对计算能力(服务器)的需求:
AI服务器有两种分类方法:
(1)根据应用场景:AI服务器根据应用场景可分为深度学习训练型和智能应用推理型。
培训任务对服务器计算能力要求较高,需要培训服务器提供高密度计算能力支持。典型产品包括中科曙光X785-G30和华为盛腾Atlas800(型号9000、型号9010)。
推理任务是利用训练后的模型提供服务,对计算能力要求不高。典型产品包括中科曙光X785-G40和华为盛腾Atlas800(型号3000、型号3010)。
(2)根据芯片类型:人工智能服务器为异构服务器,可根据应用范围调整计算模块结构,可采用CPU+GPU、CPU+FPGA、CPU+TPU、CPU+ASIC或CPU+各种加速卡等组合形式。
过去,X86服务器主要用于人工智能计算基础设施。然而,随着人工智能算法和芯片的发展,GPU、以FPGA和ASIC芯片为核心计算单元的AI专用基础设施增多。
目前,CPU+多GPU是产品中最常见的方式。
常见的AI服务器分为四路、八路、十六路。
一般来说,通用服务器主要采用CPU主导的串行架构,更擅长逻辑操作;人工智能服务器主要采用加速卡主导的异构形式,更擅长扩大吞吐量的并行计算。根据CPU的数量,通用服务器可分为双、四、八等。
虽然人工智能服务器通常只配备1-2个CPU,但GPU的数量显著占主导地位。根据GPU数量,人工智能服务器可分为四、八、十六个服务器,其中8个GPU最常见。
GPU服务器的超级计算功能可用于搜索、大数据推荐、智能输入法等海量数据处理的运算。与通用服务器相比,它在数据量和计算量方面具有双重效率优势。
此外,GPU还可以作为深度学习的训练平台,其优点是:1、GPU服务器可以直接加速计算服务,也可以直接与外界连接通信;2、GPU服务器与云服务器配合使用,云服务器为主,GPU服务器负责提供计算平台;3、COS可以为GPU服务器提供大数据量的云存储服务。
目前,各行业与人工智能技术的深度结合和应用场景的不断成熟和实施,使人工智能芯片朝着多元化的方向发展。为了满足芯片的多样化,服务器的类型将越来越丰富,并适用于越来越多的工业应用场景。
人工智能服务器的市场格局
根据国际数据公司IDC发布的2021H2全球人工智能市场半年跟踪报告,2021H1全球人工智能服务器市场规模为156亿美元,浪潮信息在世界人工智能服务器市场占有率为20.9%,份额同比增长3.6pct,销售额同比增长68.3%,位居世界第一。
此外,根据IDC发布的《2021年下半年(H2)中国加速计算服务器市场报告》,中国市场人工智能服务器占有率达到52.5%,中国人工智能服务器市场份额连续5年保持在50%以上。
2021H1全球AI服务器市场份额:
数据显示,在国内人工智能服务器代表厂商中,浪潮信息是全球领先的服务器厂商,拥有全面的人工智能计算产品阵列和性能领先的Transformer培训服务器,能够提供从芯片、板卡、整机到平台软件的全栈人工智能计算方案;2022年,浪潮人工智能服务器在MLPerf基准评估中获得半数以上赛道冠军;浪潮NF568M6是公司最强的人工智能服务器之一,主要用于超大型数据中心。
中科曙光是中国高性能计算领域的龙头企业,也是亚洲最大的高性能计算机制造商。大力发展云计算、大数据、人工智能、边缘计算等先进计算业务,构建完整的人工智能计算服务体系,参与国内多个超级计算中心和智能计算中心的建设。
目前,中科曙光的人工智能服务器分为培训和推理两种,主要采用海光/寒武纪芯片。目前,它已与百度“文心一言”合作,为其工业化应用提供计算能力支持。
拓维信息是华为升腾人工智能战略合作伙伴,华为全方位战略合作伙伴,在“鸿蒙+鹏鹏+升腾”基础软硬件领域与华为建立全面合作;其中,兆汉系列人工智能服务器是基于华为达芬奇架构3DCube技术的升腾人工智能处理器;兆汉人工智能服务器涵盖培训、推理等领域,广泛应用于智能城市、运营商等行业的数据中心和计算能力中心。
工业富联在云计算服务器出货量方面继续位居世界第一,推出新一代云计算基础设施解决方案(模块化服务器、高效计算HPC),解决人工智能计算能力井喷需求;其客户布及世界,覆盖微软、谷歌、英伟达、英特尔等海外龙头工厂;工业富联云计算产品包括云服务器、高性能服务器、人工智能服务器、边缘服务器和云存储设备。
自2017年以来,随着边缘计算和“物联网+”的兴起,人工智能等需求的叠加,服务器市场开始火爆。
根据IDC数据,15个重点国家的计算能力指数平均每增长1点,数字经济和GDP分别增长3.5‰和1.8‰,预计这一趋势将在2021-2025年继续保持。
此外,当一个国家的计算能力指数达到40分以上时,国家的计算能力指数每上升1点,其对GDP增长的推动力就会增加到1.5倍,而当计算能力指数达到60分以上时,国家的计算能力指数每上升1点,其对GDP增长的推动力就会增加到3.0倍,对经济的推动作用就会变得更加显著。