ChatGPT元年:野心战略以及绕不开的困难

2009年4月,硅谷创业教父保罗·格雷厄姆(PaulGraham)撰文记录了五位对自己影响最大的创业者。他将时年24岁的山姆·阿尔特曼(SamAltman)与苹果、Google的创始人们并列。“辅导创业公司的时候,提到设计问题,我会问‘史蒂夫(乔布斯)会怎么做?’但关于战略或者野心,我会问‘山姆会怎么做?’”

阿尔特曼当时只创办过一家公司——Loopt,一个没能建立网络效应的社交网络公司。之后十几年,他在硅谷创业圈的人气随着格雷厄姆的孵化器YC一同壮大。但直到OpenAI,更具体来说,从去年11月OpenAI发布ChatGPT至今的这一年,全世界才第一次见证了他的野心以及与之匹配的战略能力。

11月6日,OpenAI举办了成立以来的第一场开发者活动。在类似早年苹果发布会的小会场里,阿尔特曼没有提及太多新技术,更像是过去一年的发展总结,全面展示了OpenAI大模型上的技术实力。

过去一年,ChatGPT从一个只能处理文字信息的网页端应用,变成了一个可以同时处理文字、语音、图像信息的App,吸引上亿人每周使用。

OpenAI从一个研究机构变成了估值900亿美元的超级创业公司,聚拢了200万开发者用它的技术开发各种应用。

世界也因为ChatGPT掀起的浪潮发生改变。根据柯林斯词典统计,人们在2023年提及“AI”的次数,是去年的四倍。红杉资本称,他们的收件箱被“AISalesforce”“AIAdobe”“AIInstagram”等各种创业想法填满,整个科技行业陷入到了人才争夺和采购GPU狂潮中。

在中国,几乎每个大点的互联网或科技公司都要研发大模型。已经退休的互联网公司高管、卖掉公司已经开启新创业的创业者,以及有技术积累的年轻学者看到ChatGPT后迅速采取行动,要拥抱大模型时代。过去一年,中国诞生了多家独角兽公司,以及近百个大模型。

经历过互联网公司的大膨胀和反垄断之后,全球政府对这次AI浪潮都保持警觉。过去一年,欧盟、中国和美国都以前所未有的速度推动针对人工智能的监管。

整个行业和OpenAI的距离,在快速缩短也在拉大

去年ChatGPT刚发布时,它只是一个处理信息比较有限的聊天机器人,输入文字或代码组成的句子,反馈文字和代码。凭借着它背后吞掉海量数据、靠着大学生们反复调教的大模型,ChatGPT超越了以往所有的聊天机器人。用户抛来的各种各样的问题,它大多能给出媲美人类的回复。

尽管有时候会胡说八道(行业内一般称之为“幻觉”),但凭借着一次次令人惊讶回复,让人们见识到了人工智能向万能的通用助手靠近是什么情况。

今年9月,ChatGPT根据病情描述和检查报告结果,帮助一位母亲给她的孩子找到了病因——新生儿发病率最高只有0.025%的脊髓栓系综合征(TCS),再次刷新了人们对ChatGPT能力的认知。在ChatGPT给出结果前,这个母亲已经带着孩子求医三年,找了17个医生,都没有诊断出真正的病因。

9月份,OpenAI向付费用户开放GPT-4Vision(GPT-4V),能把图像当做一种信息处理,理解图片中的内容,并对提问给出回复。

“大模型时代的黎明。”微软的研究人员今年10月在一篇长达166页的报告中提出,“GPT-4V在处理任意交错的多模态(文字、图像)信息方面具有前所未有的能力,是当今最强大的多模态通用人工智能系统。”

自动驾驶公司图森中国CTO王乃岩测试了GPT-4V在自动驾驶场景中的应用。他给了GPT-4V7张真实驾驶环境中的图片,让它给出驾驶建议,多数情况得到了安全的回复。“适当的提示词应当可以完全发挥出GPT-4V的实力。”他认为,尽管存在“幻觉”问题,“合理使用这样的大模型可以大大加快L4乃至L5自动驾驶的发展。”

OpenAI成立之初是一个开放的研究机构,它在2020年发布GPT-3时详细公开了技术细节。ChatGPT点燃人工智能市场后,GPT-3降低了整个行业追赶的难度。

与GPT-3.5同等水平的MetaLlama2在今年7月发布。Meta将其开源,并允许商用。整个行业一夜之间来到了一个新的起点。今年10月,中国一批研发大模型的公司,比如科大讯飞、阿里巴巴、腾讯都在不同场合宣布自研的大模型(中文)能力达到了GPT-3.5的水平。

还有一些公司宣称在一些能力上追上了GPT-4,比如Google的PaLM2、OpenAI最大竞争对手Anthropic的Claude2,以及百度的文心大模型4.0。

在一些特定的功能上,追赶者甚至比OpenAI做得更突出。今年5月,Anthropic发布了大模型Claude-100k,把大模型处理文本的长度扩充到了100k,在当时GPT-4最多处理32k文本的情况下,开辟了大模型处理更长文本的研究方向。处理更长的文本可以把大模型用到更多的场景中,比如金融、法律等。

中国大模型创业公司围绕文本长度竞赛。今年10月,清华大学助理教授杨植麟创办的月之暗面宣布其大模型可以处理20万字。紧跟着王小川创办的百川智能宣称能处理35万字(192k)。本周,李开复牵头创办的零一万物宣称可以处理40万字(200k)。直到今天OpenAI发布GPT-4Turbo,ChatGPT处理的文本长度才到128k。

“我们知道大的方向是做多模态大模型,但具体要怎么做?用什么样的算法做?还不算特别清楚。”一位中国头部互联网公司的大模型开发者说。

今年5月,Google宣布已经开始研发多模态大模型Gemini。一些大模型从业者在接受媒体采访时提出,YouTube拥有互联网上最大、最丰富的图像、音频和字幕(文本)数据,是Google研发多模态大模型的“王牌”。不过Google到现在也没有发布Gemini。

而且OpenAI的实际进展可能比已经公开的更显著。根据OpenAI公布的技术报告,GPT-4、包括9月发布的GPT-4V,在2022年就完成训练。山姆·阿尔特曼在10月初的一场活动上说,OpenAI已经启动GPT-5、GPT-6的训练,会继续沿着多模态方向更进一步,不只是多模态输入,还会做多模态输出,提升模型的可靠性,开发个性化的大模型。

ChatGPT正在变成超级应用,但大模型的成本问题还没解决

OpenAI成立八年,至少试过6种不同的技术产品,从机器手到AI游戏机器人,以寻找AI普及的突破口。在ChatGPT火了之后,成为了OpenAI大多数技术产品的载体。过去一年,OpenAI围绕着它全力投入,不断把过去多年研发的技术投入其中。

刚发布时,ChatGPT不过是一个临时的产品,只能通过网页使用。现在OpenAI开发了一个界面直观、交互简单的手机应用,一步步增加功能,把它变成一个超级应用:

在这个思路下,一众给ChatGPT做外壳,改善用户体验的产品已无活路。阿尔特曼在10月初的一场活动中说,“做一个UI更好的ChatGPT,并不是一个好主意。”

阿尔特曼将自己在YC时期教创业者的增长方法论用于ChatGPT。他快速迭代产品,要让ChatGPT留住最广泛的用户。互联网创业的经验是,只有用一个入口抓住最多用户才有机会建立平台经济,获得无限收入。ChatGPT就是目前最大的AI入口。

构建入口的过程里,OpenAI与最大投资方微软直接冲突。

今年2月,微软上线NewBing,让用户在使用Bing搜索时调用ChatGPT。但三个月后,OpenAI上线插件,让用户在ChatGPT提问时能调用搜索引擎。都是GPT大模型与Bing搜索的组合,但入口不同决定了用户归属哪家公司。ChatGPT手机应用吸引到大批用户的同时,Bing搜索在全球搜索引擎市场的份额跌回了2018年水平。

今天的开发者活动中,OpenAI推出了GPTs功能。根据阿尔特曼的演示,用户只需要输入要求、上传特定的数据文件等,就可以借助ChatGPT做出来一个定制版本的ChatGPT,全程不用任何代码。

OpenAI还计划上线一个GPTStore,让用户上传/下载各种定制的定制版GPT,就像苹果为手机应用开发了AppStore那样。一个AI时代的平台产品野心完全公开。

除了ChatGPT快速壮大,还没有哪家公司或创业者靠着大模型挑战一个行业既定的商业规则。原本已经有用户或建立付费商业模式的大公司,比如微软Office、Salesforce、Adobe等,都在将大模型融入到成熟的产品中,让用户每个月多交10-20美元。

还有一些公司寄希望于用大模型给萎靡的创新业务找到新故事。最典型的例子就是Meta,今年9月发布了一款搭载人工智能助手的硬件产品MetaSmartGlasses。

“去年人工智能突破前,我认为只有引入更强的屏幕、全息影像这些技术,智能眼镜才会无处不在。”MetaCEO马克·扎克伯格(MarkZuckerberg)说,“现在,我认为人工智能技术对于智能眼镜的普及和其他AR技术一样重要。”

本身有云计算业务的大公司进入大模型市场,主要还是卖资源。比如微软、Google、亚马逊、阿里巴巴、腾讯等,它们都会投资大模型公司,将其作为平台上的大模型API对外出售。它们也会训练一个大模型,但主要作为获客手段,吸引客户利用它们的云计算资源训练、部署大模型。

至少目前为止,大公司对AI大模型的投资额远超过风险资本。

在OpenAI与微软之外,Anthropic先后拿了Google、亚马逊的投资;李开复的创业公司拿了阿里云的投资;智谱拿了腾讯、阿里的投资等。

过去一年,一批创业公司开始探索大模型的具体应用。比如用大模型做各种虚拟角色的Character.AI、做个人超级助理的InflectionAI、虚拟英语教师Speak、用大模型做营销方案的Jasper、人工智能法律助手Harvey。

不管是大公司做产品,还是小公司创业做AI应用,当前面临的最大问题都是大模型使用成本太高。微软的基于GPT-4开发的编程助手GitHubCopilot吸引了超过100万付费用户,但使用算力太多,最后导致平均每个用户亏损20美元。

大模型与其他软件应用不同,不仅训练起来费钱,运行起来更烧钱。大模型想要处理用户输入问题,基本上每个字都要跑一遍大模型。参数上千亿的大模型,每次跑一遍都要调用多个A100GPU,每个价值1万美元。比如大模型想要处理100个字的问题,就要运行100遍大模型。给出回复时,类似的情况还要再来一遍,成本更高。

为了吸引开发者进入自己的平台,OpenAI今天大幅降低开发者使用GPT-3.5和GPT-4的成本。

GPT-3.5是当前最便宜的大模型,用它处理一个500字的问题,并给出500字的回复,价格大概是0.003美元,约等于人民币0.022元——一个看上去微不足道的数字,但如果每天处理1000万条,这个数字就会抬升到22万元,相当于一年8000多万。如果换成GPT-4,一年成本就会超过10亿元。

中国想用大模型改造业务的公司类似,他们虽然研发出了千亿参数的大模型,但在具体应用中,大多使用参数只有数十亿参数或者百亿参数的模型,也因此影响了最终效果。

OpenAI等公司也在持续调整大模型算法降低大模型的运行成本,但最终绕不开的是英伟达的“税”。根据咨询机构TheInformationNetwork总裁罗伯特·卡斯特拉诺(RobertCastellano)等人的报告,英伟达以不到4000美元的成本向台积电、SK海力士采购关键元件、造出H100芯片,然后以40000美元的单价售出,毛利率超过90%。

现在整个大模型行业大致找到了两个解决办法。一种是科技巨头自己下场研发芯片,比如Google、亚马逊、微软,甚至OpenAI都在考虑针对AI运算自研芯片。

另一种则是让消费者买更适合大模型计算的手机和电脑,分担算力成本。高通、苹果近期发布新款笔记本电脑芯片时,都会强调可以运行百亿参数的大模型,并创造了一个新的名词:AIPC。

过去一年,从AI热里收益最多的不是OpenAI

根据麦肯锡今年4月发起的调研报告,40%的公司因为生成式人工智能出现,决定加大对人工智能投资。高盛在8月预测,全球的企业今年朝人工智能领域投资1102亿美元,比去年增长20%。

据媒体报道,靠着ChatGPT,OpenAI的年收入达到了13亿美元,是它去年收入的43倍,超过了商汤。OpenAI第一次证明,不用做短视频鼓励娱乐至死,也不用像商汤那样做安防“集成商”,一家公司单凭先进的人工智能技术也可以获得可观收入。

同时,OpenAI的估值也从去年10月的不到200亿美元增长到了近900亿美元,成为全球第三大独角兽,仅次于字节跳动和造火箭的SpaceX。

不过OpenAI不是最大的受益者。资本市场现在更相信科技巨头在AI里的潜力。

它们掌握着人工智能领域必不可少的数据、算力、使用场景,以及客户群体。相比着OpenAI领先的大模型技术,这些基础设施一样的资源,要比技术本身更稀缺。

“护城河在于客户,而不是数据。”红杉资本在今年9月发布的生成式人工智能报告中写道,他们之前认为,最好的生成式人工智能公司可以凭借数据建立领先优势,但后来发现并不稳固:“生成式人工智能应用产生的数据,并没有创造出不可逾越的护城河,而工作流程、用户网络,正在创造更持久的竞争优势。”

自去年ChatGPT发布到现在,标普500只涨了10%,微软的股价增长近50%,市值增加了7400多亿美元。它给OpenAI投资100亿美元,已经约等于不用花钱。

一开始被认为可能遭受巨大冲击的Google,市值增加了3200多亿美元;靠着开源大模型追上来的Meta,市值增加了近5000亿美元。

当然也少不了英伟达,凭借着对GPU垄断的市场地位,过去一年其市值增加了7100多亿美元,成为了芯片行业第一家市值万亿美元的公司。一年前,它还在为显卡滞销发愁,不得不降价促销。

中国大模型行业声量最大的百度、科大讯飞,一年来市值分别增加了27亿美元和45亿美元。而作为上一代人工智能公司的代表,商汤虽然也发布了大模型,但股价这一年下跌超16%。

在人工智能投资方面,中国与美国是全球投入最多的两个国家。根据斯坦福大学统计的数据,在2019年之前,中美之间人工智能投资差别不算太大,而到了2020年、2021年,美国对人工智能领域投资已经从原本超中国70%,变成了是中国的2.7倍、3.1倍。

这两年正值OpenAI发布GPT-3,证明了更大的模型可以有更好效果,并坚定追加投入,去研发ChatGPT。不过在2022年,全球对人工智能的信心都减少了,整体投资额相比上一年明显减少。

过去一年,随着ChatGPT发布,全球加大人工智能领域投入,中美在人工智能领域投资的差距再次缩小,但能多大程度上弥合技术差距,还是一个未知数。

对大模型监管的不同态度,对话语权的争夺

2021年,欧盟已经提出监管人工智能的框架,但没有推进下去。毕竟那时的人工智能还不算过时的浪潮。

中国在今年4月发布《生成式人工智能服务管理办法(征求意见稿)》,8月正式实施,要求每一个在中国境内提供服务的大模型,都要报告训练数据,经过有关部门备案和安全评估后,才能公开提供服务。目前有10多家大模型公司通过备案。

上个月,美国总统拜登(JoeBiden)签署通过关于人工智能的监管法令。根据白宫发布的情况说明,美国把监管重心放在了下一代大模型上,要求大型AI公司开发对“国家安全、国家经济安全等构成严重风险”的大模型时要通知政府。

颠覆性的新技术与监管政策常常对立,逐渐在冲突中找到平衡。互联网诞生之初,加密传输数据曾被认为会保护恐怖主义,连浏览器在不同国家都要用不同级别的加密技术。网约车在全球各地都经历过违规时期,加密货币至今还在灰色地带。

人工智能是少数主动拥抱监管的新兴行业。ChatGPT发布半年后,阿尔特曼就坐到了美国参议院听证会的证人席上,呼吁议员们监管人工智能:“如果这项技术出了问题,后果可能会非常严重。”现场的一名议员听到阿尔特曼的发言后说:“很少有公司在国会面前说,请监管我们。”

5月底,非营利组织CenterforAISafety发布了一篇公开信,呼吁政府机构应该把“减轻人工智能带来的灭绝风险”当作优先事项,像对待流行病和核战争那样慎重。OpenAI的高管们、GoogleDeepMind的负责人戴米斯·哈萨比斯(DemisHassabis)、Anthropic的CEO达里奥·阿莫迪(DarioAmodei)都在名单上。他们罗列了一些大模型可能用于作恶的证据,比如助长虚假信息传播等、可以帮助制造毒药。

反对AI强监管的声音同样强大,最主要的代表是Meta人工智能项目负责人杨立昆(YannLeCun)、风投a16z合伙人马克·安德森(MarcAndreessen)、斯坦福大学计算机系教授吴恩达等人。吴恩达近期与杨立昆等人共同签署了一封呼吁人工智能开放的公开信。他们和开源运动的积极支持者们都相信,当技术向所有人彻底开放,就能化解危险。

严格的监管后,新进入者、小公司往往难以负担合规成本。银行、能源、烟草等行业转向强监管后都没什么新公司。原本领先的公司因此受益。

在今年5月的美国国会听证会上,一位参议员质疑:“少数几家公司控制、影响着所有人的生活”,会不会有危险?

阿尔特曼承认,最终只有少数公司能制造强大的模型,这有利有弊,因为“你们需要盯着的公司也少了”。

THE END
1.怎么对CHATGPT规定字数1. 设置最大令牌数:CHATGPT将文本处理为一系列令牌,可以根据令牌的数量来限制生成的文本长度。你可以http://www.hlwwhy.com/ask/6707816.html
2.ChatGPT小虚竹的博客想要ChatGPT回答更精准?教你3步指定角色,立即见效,一文秒懂!从入门到精通的ChatGPT文本生成指南,学生必看!GPT4o+知网降重+虚竹哥提供的10个顶级论文降重指令,gpt,人工智能https://blog.csdn.net/shi_hong_fei_hei/category_12829470.html
3.chatgpt国内能用吗chatgpt4.0国内使用步骤chatgpt国内能用吗? 很多小伙伴最近都在找怎么才能在国内使用这款工具,因为这款工具可以帮助大家解决不少文字和图片上面的问题,而开始的时候国内是没有办法使用的,不过随着时间的推移,很多更新的产生,这款工具在国内也慢慢的可以使用了。一起来看下具体的使用步骤吧。 http://www.pipaw.com/hangyenews/news_55897.html
4.分享自己的ChatGPT使用经验与教训ChatGPT在快速整合和提供信息方面非常强大。我曾在准备项目报告时,利用它快速获取了关于特定技术领域的最新进展和关键数据。这大大节省了我查阅多个来源和手动整合信息的时间。 创意激发与概念拓展: 当我在撰写文章或设计项目时遇到创意瓶颈,ChatGPT能够提供多种创意方向和概念拓展,帮助我跳出思维定势,找到新的灵感。 http://gpt.729.cn/information/585.html
5.深度报告:ChatGPT引发的大模型时代变革!人工智能大型语言模型除对话功能外,ChatGPT 也具有实现各类语言相关任务的能力,包括文章精炼、翻 译以及情绪分析等。以上各类语言能力在大规模的训练数据和升读学习架构下,使 ChatGPT 成为目前应用最为先进的语言模型之一。总体上,ChatGPT 标志着自然语言处理(NLP)和对话 AI 领域的一大步,其高质 量文字产出能力在商业、研究和开发活动https://m.163.com/dy/article/HVVKTLA3053175FP.html
6.一文看懂ChatGPT4和3.5究竟有什么区别?ChatGPT账号值得充plus吗?如果是自己写东西用或者用着玩玩,那么3.5已经够用了,因为ChatGPT是公认的最强AI,比其他的写作工具好用的不止一点点。 如果是讨厌动不动就出现红框让你刷新网页的、需要长篇文字的、长期文字工作者、做二次开发的、做测评的、或者不差钱的大佬,这个plus还是很值得入手的。20美元/月。 https://www.awyerwu.com/10290.html
7.关于最近大火的GPT4.0和ChatGPT的笔记GPT3.5大概2022年11月30日发布;GPT2.0大概2020年6月发布 GPT4基础版本大概在2022年8、9月出现,到2023年3月才发布(是因为除了能力外,还需要安全方面的灰度,致力于对社会更积极影响的一面)。 GPT4和GPT3.5、ChatGPT有何提升? 1、支持多模态。GPT4要比ChatGPT厉害10倍+。GPT3、GPT3.5是基于文字的对话形式;GPThttps://www.jianshu.com/p/1c38a8a6fda1
8.ChatGPT4.0和3.5有什么区别?我究竟该用3.5还是4.0?侠说在其概念视频中,OpenAI介绍新模型可以解决更复杂的问题、编写更大型的代码,并通过图片产生文字。此外,OpenAI还承诺GPT-4相比之前的模型,包括ChatGPT此前应用的GPT-3.5,将更加安全且具协调性。 用简单的话说,GPT-4模型改变了此前ChatGPT等历史人工智能的单一、文本短小等缺点,变身为一个能看图说话的高级“解语花”https://www.shangyexinzhi.com/article/9577468.html
9.全网最详细的ChatGPT讲解你和ChatGPT的距离只差这篇文章chatGPT这个模型,属于GPT-3.5系列。 ChatGPT-4比ChatGPT-3.5更精确、更有创造性和协作性,可靠性提高了40%。 5、chatGPT擅长 6、底层关键技术 7、个人训练ChatGPT-限制 三、chatGPT的使用 1、原生使用chatGPT(GPT3.5) 此种方式在使用的过程中,没有限制,可以充分体验到chatGPT3.5的特点 https://blog.51cto.com/51power/6049609
10.25个最佳ChatGPT替代品然而,除了其内容生成功能和其他服务,Jasper还有一个相对较新的聊天机器人。这个ChatGPT的替代品被恰当地命名为Jasper Chat,也是基于GPT 3.5,其中有更多的语言模型,并有OpenAI作为其合作伙伴。然而,与ChatGPT不同,它可以有效地被任何人使用,JasperChat是为广告、营销等企业建立的。https://www.wbolt.com/best-chatgpt-alternatives.html