ChatGPT背后的算力博弈，中国企业亟待打破美国桎梏|chatgpt的算力要求_算命

如今AIGC市场一片鲜花着棉烈火烹油，不论是ChatGPT、AUTOGPT，或者国内的文心一言，市场乱烘烘你方唱罢我登场，不断登上热搜。

华西证券预测，全球AI软件市场规模将在2025年达到1260亿美元，2021年到2025年复合增长率为41.02%。

ChatGPT繁荣的背后，是堪称天文数字的算力支持。

据测算，AI训练服务器方面，单个大语言模型训练驱动AI训练服务器需求约2亿美元；AI推理服务器方面，如ChatGPT在初期便可带动推理服务器需求约45亿美元。

算力作为大模型的核心引擎，它的计算公式很简单：有多少枚GPU芯片就能产生多大的算力，高端GPU芯片的数量，能直接影响算力的大小。

ChatGPT所需要的算力并不是固定的，反而是逐次递增。ChatGPT越聪明，背后的代价是所需算力越来越多。

据媒体推测，GPT-3训练成本预计在500万美元/次，GPT-3模型需花费训练成本约140万美元，Google的PaLM模型需花费训练成本约1120万美元。

据微软高管透露，为ChatGPT提供算力支持的AI超级计算机，是微软在2019年投资10亿美元建造的一台大型顶尖超级计算机，配备了数万个英伟达A100GPU，还配备了60多个数据中心总共部署了几十万个英伟达GPU辅助。

为了满足与日俱增的ChatGPT算力需求，微软宣布将推出基于英伟达最新旗舰芯片H100GPU和英伟达Quantum-2InfiniBand网络互连技术，推出Azure可大规模扩展的AI虚拟机系列，以显著加速AI模型的开发。

看上去，ChatGPT的背后就是满篇的英伟达、英伟达和英伟达。

实际上，英伟达作为硬件霸主，不仅在消费级市场占据大部分市场，也是AI服务器芯片领域的头号选择。

不仅涨价买不到，甚至美国还禁止英伟达卖芯片。在去年8月，美国政府发布出口管制政策，禁止英伟达将A100、H100两款芯片售往中国。

为了不丢掉中国市场，又符合美国出口管制，英伟达随后推出“性能阉割版”A800、H800芯片。但这两款芯片同样被供不应求的市场一抢而空，价格也随之水涨船高。

以百度阿里腾讯为首，国内大部分互联网公司都已经宣布进军大模型。市场统计，从ChatGPT之后，中国年内即将推出的大模型数量已超10个。

如果想要达到ChatGPT的水准，至少需要3000枚A100芯片，以9万/枚的价格来算就是2.7亿人民币才能完成一个大模型部署；10个大模型就需要3万枚A100芯片，27亿人民币。

恍惚间，矿卡时代又再次来临。

面对市场需求激增，借AI浪潮翻身的英伟达很鸡贼的推出“算力租赁”服务。

3月21日，2023年GTC大会上，英伟达创始人兼首席执行官黄仁勋推出NVIDIADGXCloud，可以为企业提供训练生成式AI高级模型所需的基础设施和软件。DGXCloud每个实例配有8个H100或A10080GBGPU，企业可以“云租赁”的形式按月租用DGXCloud集群，价格为每实例3.7万美元/月起。

英伟达真的没有替代品吗？为什么企业宁愿选择租赁，也不选择其他GPU芯片商？

IDC数据显示，国内GPU服务器在2021年占国内服务器市场规模的比例超过88.4%，使用英伟达的产品占比超80%。

AI大模型所需要的芯片在处理信息的精细度和算力速度要求更高，在超算领域，双精度浮点计算能力FP64是进行高算力计算的硬性指标。而英伟达的H100、A100是目前唯一具备这些能力的芯片。

美国卡脖子的并不只有英伟达芯片的售卖，从技术、设备、材料都限制中国企业的研发。但在美国的重重限制下，中国企业仍然顶着压力跑出几匹黑马。

根据IDC最新发布的《中国加速计算市场（2021年下半年）跟踪报告》，2021年全年中国AI服务器市场规模达350.3亿元，同比增长68.6%。

在企业级GPU芯片领域，中国厂商壁仞科技在2022年推出“BR100”芯片、天数智芯推出了“智铠100”芯片、寒武纪推出了“思元270”芯片。

其中壁仞科技称，BR100拥有全球最高算力，峰值算力达到了市场在售旗舰产品的三倍以上，16位浮点算力达到1000T以上、8位定点算力达到2000T以上，单芯片峰值算力达到PFLOPS级别。

虽然数据良好，但缺少至关重要的处理FP64的能力，依然无法完全取代英伟达H100、A100俩兄弟。

并且，英伟达使用的CUDA平台早已成为应用最为广泛的AI开发生态系统，只支持英伟达的Tesla架构GPU，在现阶段根本无法用国产芯片取代。

借着大模型东风一路上扬的不止AI服务器和GPU芯片，还有储存器市场。

ChatGPT的运行条件包括训练数据、模型算法和高算力，其中高算力的底层基础设施是完成对海量数据、训练的基础。

最显而易见的特点就是ChatGPT经历数次迭代之后，参数量从1.17亿增加到1750亿，近乎两千倍的增长，也给计算存储带来极大的挑战。

AI新时代开启，预计全球数据生成、储存、处理量将呈等比级数增长，存储器将显著受益。而计算存储是ChatGPT的重要基石，随着阿里、百度等科技巨头类ChatGPT项目入局，整体计算存储市场需求将进一步快速提升。

随着AIGC持续火热，北京、上海、广州等数字经济发达地区也出台了政策推进智算中心建设。比如，北京市提出“新建一批计算型数据中心和人工智能算力中心，到2023年，培育成为人工智能算力枢纽”；上海市提出“布局建设一批具有高性能、高吞吐的人工智能算力中心，推动公共算力服务平台建设”等。

THE END

ChatGPT背后的算力博弈，中国企业亟待打破美国桎梏

解密ChatGPT算力芯片技术

跑ChatGPT体量模型，从此只需一块GPU：加速百倍的方法来了磁盘内存gpu

算一笔细账，ChatGPT文心一言这类大模型到底要消耗多少GPU？澎湃号·湃客澎湃新闻

ChatGPT需要1万张NV顶级显卡国内仅有6家公司做到

ChatGPT两月排碳千吨？数据存储总提心吊胆？这场算力应用大赛或有解…

ChatGPT背后的算力博弈，中国企业亟待打破美国桎梏

ChatGPT火爆带动算力需求，我国算力规模能否支撑？

ChatGPT算力成本巨大，成为云厂商的一大门槛，大厂如何选择

深度拆解AI算力模型：ChatGPT的核心壁垒是什么？

大模型国产化适配4基于昇腾910使用LLaMA13B进行多机多卡训练随着ChatGPT的现象级走红，引领了AI

ChatGPT的运行模式关键技术及未来图景

ChatGPT的终极三问

透视“风口”，把脉ChatGPT

深度人工智能ChatGPT对金融科技行业的影响未央网

先锋观察ChatGPT引领视听传媒进入智能新时代

ChatGPT意味着第二次认知革命的到来