人工智能行业点评：ChatGPT对算力的需求究竟如何？策略研报数据中心|chatgpt计算数据_算命

Chatgpt成本主要可以拆分成训练和推理两个阶段。人工智能主要分为计算机视觉和自然语言处理两大基础方向，当前自然语言处理类任务基于大型语言模型（LLM，LargeLanguageModel）演进出了最主流的两个主要方向，BERT（基于Transformer的双向编码器表示技术）和GPT（基于Transformer生成预训练技术），Google属于BERT技术方向，微软投资的OpenAI属于GPT技术方向。从计算过程上，人工智能计算主要可以分为模型训练与推理两个阶段，针对大语言模型LLM更是如此，随着参数与数据规模的不断增大，将带动拉动算力需求的快速增长。

以英伟达DGXA1OO服务器作为计算资源：（1）单台服务器售价20万美元；（2）采用云服务单天成本约为460美元。根据英伟达官网数据，英伟达超算GPU系列从旧到新包括P100、V100、A100、H100等，其中，DGXA100系列服务器为2020年发布，是当前主流使用的超算服务器，单机有8个A100系列GPU，AI算力性能为5PetaFLOP/s，单机最大功率6.5kw，售价19.9万美元；如果租用云服务，根据亚马逊数据显示，在亚马逊AWS预定一年的A100系列GPU，有8个A100的AWSP4实例的平均成本约19.22美元，一天的平均成本约为461.28美元。

ChatGPT上一个30字的问题需要消耗计算资源0.12PetaFLOP/S。最常见的Transformer类语言模型在推理过程中每个token的计算成本（以FLOPs为指标）约为2N，其中N为模型参数数量（20年发布的GPT-3拥有1750亿参数，22年谷歌发布的PaLM拥有5400亿参数，由于并未公布当前GPT3.5的参数数量，当前假定参数数量为3000亿），假设模型的FLOPS利用率约为20%，粗略估计ChatGPT一个30字（假设约40个token，注：在英文语境下，一般1000个token=750个单词）问题需要的算力资源为2*40*3000亿/20%=0.12PetaFLOP/S。

推理成本：为满足当前用户访问产生的推理成本，自建IDC初始投入约在4亿美元，租用云服务每日成本约28万美元。根据Similarweb的数据，23年1月份当前ChatGPT日活约1300万人，每人平均1000字左右的问题，因此合计产生约130亿字（173.3亿个token），假设24小时平均分配任务，需要的A100GPU数量为173.3亿*2*3000亿/（20%*24小时*3600秒）=601.75PetaFLOP/S，由于访问流量存在峰值，假定访问峰值是一天均值的5倍，因此共需要602台DGXA100服务器能够满足当前的访问量。

(1)自建IDC：服务器成本约占数据中心成本30%左右，为满足当前日常访问需求，前期一次性成本投入约为602*19.9/30%=3.99亿美元；

(2)云服务：假设每天租用亚马逊AWS云服务，每天成本为461.28*602=27.77万美元。

训练成本：训练阶段每个Token的训练成本约为6N（推理成本为2N），由于每年训练成本都在快速下降，此处引用OneFlow的测算结果，在公有云中训练OPENAI的GPT-3模型需花费训练成本约140万美元，Google的PaLM模型需花费训练成本约1120万美元。

预计在ChatGPT结合Bing搜索功能后，其对算力资源的消耗将成数倍增长。当前ChatGPT模型可以理解为在一个在庞大训练数据集上训练的LLM，它会将训练期间的知识存储到模型参数中。在推理过程中（使用模型生成输出），LLM无法访问外部知识，仅依靠模型参数进行计算；如果将ChatGPT与搜索功能结合，如Bing等搜索引擎，其计算过程将通过搜索引擎返回多个查询结果，并通过GPT计算生成多个响应，在返回最高分的响应给用户，其对算力资源的消耗将成数倍增长，增长倍数取决于搜索和响应的个数。

投资建议：

风险提示：

模型假设不合理对测算结果造成偏差，ChatGPT商业化落地不及预期。

THE END

人工智能行业点评：ChatGPT对算力的需求究竟如何？策略研报数据中心

如何使用ChatGPT进行数据分析统计

ChatGPT数据分析——GPT基本概念

万万没想到，ChatGPT参数只有200亿？腾讯云开发者社区

虽晚必到：ChatGPT技术总结算法序列神经网络

人工智能行业点评：ChatGPT对算力的需求究竟如何？策略研报数据中心

5种方法让ChatGPT生成统计图表，总有一种适合你无论是你ChatGPT免费用户还是Plus用户，都可以通过以上的解决

揭秘GPT4核心数据：1.8万亿参数，13万亿训练数据AI&chatGPT长臂猿

一文解析ChatGPT数据集之谜人工智能

算一笔细账，ChatGPT文心一言这类大模型到底要消耗多少GPU？澎湃号·湃客澎湃新闻

ChatGPT三篇文章摘录研究成果广西壮族自治区信息中心

ChatGPT到底都被投喂了些什么？界面新闻·JMedia

利用ChatGPT进行数据分析pdf,mobi,epub,txt,百度云盘百度网盘免费下载电子书下载电子版全集免费阅读在线阅读精校版扫描阿里云盘Kindle资源ed2k微盘作者:张俊红

开源项目推荐支持GPT的智能数据库客户端与报表工具——Chat2DB独孤风

没有这些，别妄谈做ChatGPT了模型训练

利用Chatgpt开发一款加减乘除计算器(Python代码实现)python

起底ChatGPTAPI计费逻辑，2步教你实时测算对话成本

ChatGPT怎么突然变得这么强，博士万字长文深度拆解GPT3.5能力起源