《开放加速规范AI服务器设计指南》发布

网络传播视听节目许可证(0107190)(京ICP040090)

在日前举办的OCPChinaDay大会上,业界首个面向AIGC(生成式人工智能)的《开放加速规范AI服务器设计指南》(以下简称指南)正式发布。

浪潮信息服务器产品线总经理赵帅介绍,该指南面向AIGC实际应用场景,细化完善了开放加速规范AI服务器的设计理论和方法,明确了硬件设计参考、管理接口规范和性能测试标准等,将为新兴的AI芯片创新提供有力的系统平台支撑,帮助AI芯片企业缩短研发和系统适配周期,大大减少开发费用,更快释放算力价值,有效加速多元算力产业发展,助力AIGC时代的AI计算产业跨越“创新”鸿沟。

加速开放计算产业发展,系统级产品创新是关键。在基础硬件、基础软件、核心应用、上层生态间建立起统一的技术路线及标准API接口,将加速器模块标准化,简化人工智能基础架构设计,能够有效缩短硬件开发和产业赋能周期。

当前,以大模型为代表的AIGC热潮带来了AI算力需求的爆发式增长。更丰富的算力资源成为人工智能竞争的核心基石。可以说,计算力就是生产力,智算力就是创新力。IDC预计,全球AI计算市场规模将从2022年的195亿美元增长到2026年的346.6亿美元,其中生成式AI计算市场规模将从2022年的8.2亿美元增长到2026年的109.9亿美元。生成式AI计算占整体AI计算市场的比例将从4.2%增长到31.7%。

AIGC技术创新是一项复杂的系统工程,需要基于海量数据集,在拥有成百上千加速卡的AI服务器集群上对千亿级参数的AI大模型进行分布式训练,这对算力资源的规模提出了极高的要求,也对算力系统设计带来了新的挑战,要求单机具有更高的扩展性、集群具有更高的加速比,由此对卡间互联、网络带宽和延迟提出了更高的要求。

随着AI大模型、超大模型的不断发展,芯片公司相继推出了新形态的AI加速卡来支持更高的功耗和更强大的卡间互联能力。当前,随着数据中心用户对AI计算力需求的不断攀升,全球已有上百家公司投入新型AI芯片的研发与设计,人工智能芯片发展呈现多元化趋势。但各厂商采用不同技术路线,导致产业面临硬件体系孤岛和生态割裂问题,带来算力产业发展高成本和低灵活性的问题。

“统一开放的产业标准能有效降低技术获取成本,推动创新技术普及,为产业发展赋能提速。”浪潮信息AI&HPC产品线高级产品经理张政说。

据了解,以OCP为代表的开放计算项目,推出全新的、全球化的产业协作模式,通过消除技术壁垒,加快计算产业创新的速度。其中,OCP的OAI(开放加速器基础设施)开放标准极大地激发了AI计算基础设施集成的创新。目前,已有包括浪潮信息、Intel、燧原科技等10+系统和芯片厂商,通过开放、合作为市场推出10余款符合OAM标准的开放加速AI服务器,并在全球范围内开展成功实践,充分论证了技术可行性,构建起茁壮的生态体系。

张政介绍,早在2019年OCP刚成立OAI小组时,浪潮信息作为主导的核心成员之一,牵头组织制定了UBB、OAM(云原生应用)等规范,此后又发布了业界首个开放加速参考系统MX1。浪潮信息还协同合作伙伴,共同完成了早期OAM的技术验证和积累,并发布了首款OAM服务器,将开放加速真正快速投入到产业应用中。在产业化落地的过程中,浪潮信息积累了很多经验,并总结转化从而形成《开放加速规范AI服务器设计指南》,以加速培育产业生态。

“事实上,我们也是国内最早做AI加速卡间高速互连技术的企业,对于如何构建大规模的训练系统、如何加速AI模型训练,我们有丰富的经验。浪潮信息AI服务器在市场规模和技术方面都有着领先的优势。”赵帅说。

据了解,开放加速计算的硬件架构正是为超大规模深度神经网络模型并行计算而生,天然适用于AIGC大模型训练。然而,当前开放计算技术推向产业落地的过程中,依然存在大量的定制化工作以及现有OAI标准未能完全覆盖的领域。因此,浪潮信息基于丰富的开放加速计算工程实践和产品历程,发布面向AIGC的指南,提出四大设计原则、全栈设计方法,旨在帮助社区成员更快更好地开发符合开放加速规范的AI加速卡,并大幅缩短与AI服务器的适配周期,为用户提供最佳匹配应用场景的AI算力产品方案。

其中,四大设计原则为应用导向原则、多元开放原则、绿色高效原则和统筹设计原则。基于上述设计原则,以提高适配部署效率、提高系统稳定性、提高系统可用性为目标,《指南》进一步归纳总结出开放加速规范AI服务器的设计方法,即多维协同设计、全面系统测试、性能测评调优。

业内人士认为,开放加速规范的AI服务器可为AI芯片创新提供成熟的系统平台支撑,帮助AI芯片厂商聚焦于芯片创新研发,实现更科学合理的产业分工,避免封闭技术生态存在的单点单线风险,推动智算产业生态健康发展;另一方面,基于开放加速工程实践和成熟计算平台总结的设计指南,可加速有竞争力的AI芯片的创新研发和落地部署,有效节省研发投入并缩短开发适配周期50%以上,为用户提供可以用来支撑AIGC大模型训练的多元算力解决方案,以多元算力之道破解当下AI算力供需难题。(经济日报记者黄鑫)

THE END
1.AI服务器是什么?为什么要用AI服务器?AI服务器是一种专门为人工智能应用设计的服务器,它采用异构形式的硬件架构,通常搭载GPU、FPGA、ASIC等加速芯片,利用CPU与加速芯片的组合来满足高吞吐量互联的需求,为自然语言处理、计算机视觉、机器学习等人工智能应用场景提供强大的算力支持,支撑AI算法的训练和推理过程。 https://blog.csdn.net/D404234/article/details/142382859
2.dServer人工智能服务器平台人工智能赋能各行各业,想要做好人工智能研究,离不开作为底层支撑的服务器。当前市场上的人工智能服务器大多强调硬件配置,但是人工智能作为一门新兴技术,如果缺乏训练数据以及技术支持、使用培训等服务,即使是高配置的人工智能服务器,可能只能束之高阁。 针对多样化的AI应用需求,dServer人工智能服务器采用英特尔CPU+英伟达http://ds.cstor.cn/
3.AI服务器篇AI服务器篇随着人工智能的快速发展,全球AI服务器的需求AI服务器篇随着人工智能的快速发展,全球AI服务器的需求快速增长,IDC预计,到2026年全球AI服务器市场规模将达到347.1亿美元,2021年至2026年的年复合增速为17.30%,将继续保持相对较快增长的态势。同时,全球AI服务器的市场规模占整体服务器市场规模的比例将从2021年的15.2https://xueqiu.com/5103172116/280827200
4.什么是ai服务器和普通服务器有什么区别?Worktile社区AI服务器是专门用于人工智能计算任务的服务器,与普通服务器相比,它们具备以下区别: 计算能力:AI服务器通常配备更强大的计算能力,例如更多的CPU核心、更高的主频、更大的缓存以及更多的内存。这使得它们能够处理更复杂的算法和更大规模的数据集,提供更快的计算速度和更高的吞吐量。 并行处理:AI服务器通常支持并行计算https://worktile.com/kb/ask/1381559.html
5.中国AI服务器公司排名(排行榜)塔式服务器 1.3%(1) 存储设备 1.3%(1) 展开更多 说明:中国AI服务器行业相关产业有哪些?主要分布如下:人工智能占8.0%,AI算力占6.7%,软件占6.7%,板卡占5.3%,安防占4.0%,工控机占4.0%,数字经济占4.0%,云计算占2.7%,公共安全占2.7%,区块链占2.7%,根据企业库算法分析,仅供参考。 公司https://www.jobui.com/rank/company/view/quanguo/aifuwuqi/
6.PowerEdgeAI服务器—企业级服务器Dell中国英特尔? 至强? 可扩展处理器 PowerEdge XE 服务器经过加速优化,专为人工智能 (AI)、生成式 AI (GenAI) 和高性能计算 (HPC) 而构建。凭借卓越的加速和多样化的 GPU 选项,这些功能强大的平台经过优化,可以更快地将创意转化为行动。 定制与服务 https://www.dell.com/zh-cn/dt/servers/specialty-servers/poweredge-xe-servers.htm
7.ai服务器有什么用?总之,AI服务器是人工智能应用的重要组成部分,能够提供高效、稳定、可靠的计算、存储和数据处理能力,为https://licai.cofool.com/ask/qa_3140853.html
8.人工智能服务器人工智能 (AI) 服务器https://www.synopsys.com/zh-cn/designware-ip/ip-market-segments/cloud-computing/artificial-intelligence-servers.html
9.思腾合力云计算AI服务器AI工作站软件开发英伟达代理思腾合力(SITONHOLY)是AI服务器与HPC基础架构解决方案商,作为英伟达(NVIDIA)精英级别的合作伙伴,专注人工智能云平台领域,提供云计算、云服务、AI服务器、AI工作站、深度学习训练、人脸识别服务器、GPU高性能计算、服务器租赁、系统集成、产品定制、软件开发、边缘计https://www.aiserver.cn/
10.中金:AI服务器产业链拆解中金认为,除云端算力外,AI将带来消费类硬件终端的投资机会。 摘要 1.AI云端算力市场规模的测算:我们预计2023~2025年训练型和推理型AI加速芯片可实现的增量市场规模分别为72亿美元和168亿美元,对应服务器的出货增量分别为7.5万台和17.5万台,对应服务器的市场规模分别为149亿美元和348亿美元。考虑到AI应用的持续推广和https://wallstreetcn.com/articles/3685834
11.2024年中国AI服务器产业链图谱研究分析(附产业链全景图)受益于人工智能和算力市场发展的推动,中国AI服务器市场规模实现了逐年增长,中商产业研究院发布的《2024-2029年中国服务器行业需求预测及发展趋势前瞻报告》显示,2022年末,国内市场总规模超过420亿元,同比增长约20%,2023年约为490亿元。市场增速逐步放缓,中商产业研究院分析师预测,2024年市场规模将达560亿元。 https://www.eet-china.com/mp/a361068.html
12.人工智能计算新华三集团H3C UniServer AI一体机是基于新华三新一代人工智能服务器,不同的产品选择及软硬件一体化解决方案,可应用于语音识别、图像分类、机器翻译等多种人工智能业务场景,以及助力元宇宙生态的算力平台。 了解详情 H3C UniServer R5300 G3服务器 H3C UniServer R5300 G3,面向人工智能和高性能计算领域的全新一代GPU服务器,可https://www.h3c.com/cn/Products_And_Solution/Server/H3C/Products/GPU_Server/
13.2024年中国人工智能产业链图谱研究分析(附产业链全景图)AI服务器是一种能够提供人工智能(AI)的数据服务器,它既可以用来支持本地应用程序和网页,也可以为云和本地服务器提供复杂的AI模型和服务。当前受市场需求影响,AI服务器作为算力基础设备,市场需求量实现上升。中商产业研究院发布的《2022-2027年中国服务器行业需求预测及发展趋势前瞻报告》显示,2022年AI服务器市场出货量https://www.seccw.com/Document/detail/id/27795.html