好像所有人都在赌,赌ChatGPT能够撞开人类通往通用人工智能(AGI)的大门。但事实是,ChatGPT还有太多不完美:它无法回答所有问题,会一本正经地胡说八道;即使依托微软Azure强大的云能力,也没能在访问量陡增时逃过宕机的命运;此外就是钱的问题——有传言称OpenAI在GPT-3.0的训练周期内花费上千万美金,但至今仍没人能准确说出OpenAI推出GPT模型至今总共花了多少钱。
本文目录:
甲小姐:当年小冰不温不火,这一次ChatGPT火到出圈,除了技术水平差异,原因还有什么?
张斯成:第一,ChatGPT的交互界面极其简单,用户打开界面输入问题就能得到答案。极简化增大了出圈的可能性——过去几年互联网上所有现象级产品没有一个不是简单的。
对比一下,小冰当时推出了一个卡通形象,文质彬彬的,拉高了人们的期待,而OpenAI没有任何“人设”,反而表现超人预期。不过从产品角度来看,ChatGPT非常ugly,阿尔特曼(OpenAICEO)自己也说这是一个糟糕的产品,也会输出一些错误的信息。
第二,它很有话题性。ChatGPT会一本正经地胡说八道,有些很好玩儿的回答,有话题性,容易通过社交媒体传播,自媒体就会炒作,再加上比尔·盖茨、马斯克等大佬助推,无形之中加快了它的出圈。
第三,ChatGPT非常拟人化。它会像人一样和你互动,比如会告诉你这个问题我不能回答,或者不知道答案,这样它在犯错时会让人有很高的容忍度。
普通人对“智能”的感受和专业人士对智能的定义不一样,大众对智能的定义是“要像个人”,就是能够“像人一样表达”。和养宠物一样,我们觉得宠物聪明会说宠物“通人性”,而不是它一定要知道1+1=2才叫智能,现在看机器也一样。这是一种上帝视角,我们觉得人类自己是聪明的,所以只要宠物或机器具备某些“像人”的特征,我们就认为它聪明、可爱,就愿意和它交往。但这不是OpenAI刻意设计的,只是ChatGPT能够达到这样的效果。
最后,OpenAI选择在去年11月底推出ChatGPT也是个很聪明的选择。我相信阿尔特曼跟和萨蒂亚(微软CEO)两个人肯定讨论过什么时候推出来。据报道,其实去年夏天阿尔特曼就给萨蒂亚和比尔·盖茨都演示过这个产品了,所以他们这么有信心推动100亿美元投资,估计是看到了ChatGPT和GPT将对整个微软的商业体系产生巨大加成,以及在竞争战略上的重大机会。
甲小姐:假设ChatGPT在去年7月份亮相,它不会像现在这么火吗?
张斯成:有可能不会。首先技术准备不足,最近它在微软Azure云上也因请求过多而停服了。估计去年演示的时候还是GPT-3.0,年底推出的是GPT-3.5,3.0到3.5还是有不少改进的,特别是CoT(思维链,ChainofThought)能力。一般来讲,千亿参数规模以上的大模型,才可能涌现出“CoT”等强大的能力,而CoT的出现,可能正是ChatGPT产生类似“推理”效果的关键。因此,如果去年7月就推出的话,交互效果可能没有这么好。
甲小姐:展开说说“动作快到不像微软”。
张斯成:一个成熟的大厂做一个项目,从立项到最后落成,没两三个月根本干不出来。举个例子,Office365在微软收入中是举足轻重的。它要接入GPT这样的外部模型并不只是对接一个API这么简单,因此不仅要保证两个产品之间的无缝对接,还要保证向前兼容已有的客户和服务。中间必须经过大量的测试和调试,两三个月在工程上已经是极限了,所以我推算微软可能已经秘密准备了好几个月。
甲小姐:微软这么果断allinChatGPT的深层次原因,是不是和CEO萨蒂亚这个人有关?
张斯成:皮柴(谷歌CEO)和萨蒂亚是两种完全不同的风格。皮柴相对保守,但萨蒂亚是革新派。
萨蒂亚上台的时候比尔·盖茨就要求他要做变革,他后来写了一本书,叫《Refresh》(中文版译名为《刷新:重新发现商业与未来》),讲了怎么把微软这家几十年的老IT公司变成一个有战斗力的新公司。
上任以来,他接受了Windowsmobile的失利,承认收购诺基亚是一笔失败的交易,并开始积极参与开源社区的建设。同时,为了在内部树立敢于创新的作风,也在公开场合表明自己喜欢苹果的iPhone,因为上面有所有微软的App。
他在微软最大的成就是把Azure给救活了。微软的基本盘就是Windows和Office,Azure在微软其实一直不温不火,但云时代前两个东西已经不行了,所以他把所有东西都云化,全部转向Azure。现在Windows操作系统已经几乎没怎么赚钱了,主要是Azure上的Office365和Dynamics365。Dynamics365在中国市场并不常见,因为主要还是服务国际客户,但它的定位,是要帮助微软深耕企业服务领域,逐步渗透和占据客户的业务场景。
所以深层次原因还是人。我认为硅谷有三个差不多同一量级的人:马斯克、阿尔特曼和萨蒂亚。马斯克不用说了,是我偶像;阿尔特曼是有机会追赶马斯克的人;萨蒂亚可能跟他们不在同一量级,但他还是很牛的,能够让大象跳舞,让微软有这么大的变革,这很不容易。
甲小姐:这三位都极有魄力。
张斯成:有勇气,有想法,有谋略。
萨蒂亚这一次的谋略太明显了。我是做战略的,这件事你说没有计划过我是不相信的。我猜测他不仅计划过,背后肯定还模拟演练过好多次,因为这是一个赢面很大的AB策略——
从A面看,微软通过控制OpenAI和ChatGPT直接占领了AGI路途中的一个战略制高点,对搜索引擎的长期范式发起挑战,充分利用了谷歌过去几年保守怠战的弱点,如果能一气呵成,那么就打破了谷歌在搜索领域长期的垄断地位,让Bing重获新生;
从B面看,微软直接冲击对方的顶梁柱业务,釜底抽薪,逼着整个搜索行业重整成本结构,大家一起耗着。而谷歌财务结构的耐抗性要明显差于微软,股价持续大跌,资本和人才的虹吸效应加剧,最后导致谷歌内部的剧变,这种惨胜也能改变双方的军备格局,长期战争胜利的天平就会发生倾斜。
另外,从微软角度出发,他们把GPT接入了Office,是因为GPT模型本质上相当于一种AI的能力输出,对Office的加持效果是最明显的。新版Office出来以后,我估计很多在线文档都会处于竞争劣势。
甲小姐:对大部分人而言,如何抓住ChatGPT这一波机会?
张斯成:目前看就是三条路径:留在大厂、自己创业做垂直场景,或加入王慧文这样的团队。
甲小姐:大家首先在问,谁最有机会成为“中国的OpenAI”?
张斯成:关于谁能成为“中国版的OpenAI”,前几天李志飞(出门问问创始人)说过可以分成七大门派(包括他的“自成派”)。我个人的看法是,无法得出一个简单的论断:大厂队是最有可能在商业化层面接近微软加持下的OpenAI的,国家队和准国家队是最有可能赢得政策性支持并获得最终清场权的,而民间队是最有可能在创新层面上突破的,特别是今日之前至少已经投入LLMs研发12个月以上的团队。
总的来看,要做出“中国的OpenAI”需要三种能力:资金、人才、场景。
大厂不缺场景,也不缺钱,再卡住人才,民间力量很难做起来,因为做这个需要有一定人才密度,你看OpenAI虽然人不多,但里面每一个拿出来都是大牛,一群大牛才有可能做出一个OpenAI,否则到最后只能follow别人。
甲小姐:OpenAI也会被质疑商业化。
张斯成:阿尔特曼被问过很多次商业化问题,他的回答是“Ihavenoidea”,中国有人这样说可能估值马上砍一半。
因此阿尔特曼提出了万物摩尔定律:未来在AI时代,社会成本主要有两大构成,一个是AI的获取成本,一个是能源的获取成本。这两大成本会急剧降低,当它们趋近于0的时候,社会中的商业化就不再是一个难题,因为“商业化”这个概念可能会产生根本性改变,或者消失。
甲小姐:事实是,OpenAI已经依靠微软走上商业化道路了,马斯克甚至抨击他们已经违背了OpenAI的初衷。
张斯成:OpenAI确实面临很现实的商业化问题,他们和微软签了一个协议,体面地解决了商业化难题。他们签的协议也是脑洞大开,相当于微软租了这家公司,微软给OpenAI投资,OpenAI帮微软赚钱,OpenAI壮大到一定程度后就能把自己的股份赎回去。
这是四两拨千斤,太聪明了。更何况ChatGPT爆火之后,大家似乎也瞬间相信了OpenAI的商业潜力。OpenAI预计今年会有2亿美元收入,明年收入达10亿美元。现在大家不会再问阿尔特曼商业化问题,只会关心他们什么时候优化出GPT-4。
张斯成:大厂一定会做同质化平台,而不是差异化平台。现在国外有论文,有开源代码,大厂也不用从头开始,可以直接在GPT-3.0上搭。对于大厂的动作力度,我有几个判断:
因为有“AllinAI”的誓言,而且全球两大搜索引擎都做了,百度也必须要跟进,以保持同一梯队的资格;
字节和腾讯都是做内容的,如果他们不做就可能把一些业务拱手让人,所以他们必须要做;
阿里和华为两家我认为至少有一家会做,也可能是两家都做。他们都是有能力的,阿里内部有达摩院在做M6大模型,华为也有盘古大模型。但华为比较低调,经常都是先做了再说,他们可能不会特别突出自己的大模型能力,而是会独立做一些基础设施,比如大算力芯片等;阿里可能会考虑将大模型能力运用到电商领域,毕竟电商还是阿里目前的基本盘。另外,从云计算的层面看,阿里可能会看重华为的做法,如果华为把大模型作为云资源销售的重要利器,阿里就不得不跟进了。
甲小姐:现在也有很多创业公司已经在布局了,你能否画一个界限,资金储备在多少钱的公司有机会成为中国的OpenAI?
张斯成:100亿美金。很简单,马斯克他们用10亿美金设立OpenAI,之后微软2019年又投了10亿美金,现在20亿美金花完了,微软又宣布未来投入100亿美金,这足够OpenAI烧十年。
不过我认为在中国从头做大模型可能不会用这么多,但估计至少要投入两三百亿元人民币。中国人工和电力成本可能低一些,但训练成本、机器成本、芯片成本以及聘请科学家的成本也是不低的。所以这是个100亿俱乐部。
甲小姐:你认为除了钱,创业公司要做大模型还有哪些门槛?
张斯成:大模型的算法本身不是门槛,这些都有很多公开的论文。存在的门槛除了资金以外,主要还是人才和数据,特别是有丰富经验的工程化人才,和高质量的训练数据。即便在foundationmodel上去做fine-tune,去做垂类模型,也是需要相当的人才、算力、数据储备的。
当时国内大多数公司还是以Bert路线为主,只有OpenAI在执着做GPT。直到11月份ChatGPT出现,就开始在各种群里进行疯狂测试。
甲小姐:你的计划是什么?
张斯成:我在去年12月决定要下场的,不能错过这个未来十年最大的机会。但我认为自己没有足够的号召力组队从头去做大模型,也不能做太通用的场景,所以打算做一些垂类场景。在这个层面上,我对老王(王慧文)挺身而出连钱带人一起去做中国版OpenAI是相当敬佩的。
甲小姐:你对技术合伙人有清晰的画像吗?
甲小姐:你现在看好的垂直场景有哪些?
张斯成:我比较看好几大类:
第一个是教培行业。当然是在政策支持的领域,比如职业教育。可以利用Bot(机器人)的方式开展的教培,让用户自行选择需要什么样的服务。大语言模型目前展示出来一个很有意思的特点,就是可以帮助强化认知教育的效果。但这个领域应该如何开展可能需要一定的技巧。
第二个是设计领域,特别是在高维设计方向上,目前复杂度是需要降低的。比如建筑领域需要各种设计视图和渲染效果,游戏领域需要快速建模和智能交互,工业制造领域需要在条件约束之下尽可能激发创意,这些都可以用生成式AI技术来帮助提效。
但我觉得等这波热浪稍微降温之后会看得更清楚,因为我也存在认知盲区。现在太热了,过热的时候容易导致一些错误的判断。
比如我个人认为生成式AI在医疗领域会有很大可能性,但是很少有人讨论这方面。医疗领域有两大场景,一个是医疗影像,一个是生物制药。
生物制药领域谷歌已经开始做了,他们的Alphafold就能预测大量的蛋白质3D结构。这几年在硅谷已经有公司在往这个方向尝试,利用AI来帮助寻找新的药物靶点或合成新的小分子药品。但这块必须要和药厂深度合作,因为需要足够的数据源对模型进行训练。
另外医疗影像方面也有很大的机会,对影像的诊断是一个重要场景,比如说国内的联影医疗已经利用AI手段帮助医生做CT影像的灶点排查。随着大语言模型在多模态领域的扩展,相信这块能够成为新的蓝海。
甲小姐:从技术上看,GPT和Bert等大模型中存在一个最优路径吗?
张斯成:在和我沟通过的人群中,这个问题可以分成三类情况:
第一类是专业人士,他们不会认为谁比谁更优。客观来看,Bert和GPT在技术上是不分伯仲的,只是大家各有侧重。谷歌内部除了Bert也在做其他模型,但他们现在确实承认GPT表现出来的一些特性非常值得研究。因为目前来看,大家普遍认为要实现AGI,超大模型是一个很有希望的路径,但不是非GPT不可。只能说,在朝AGI演进之路上,OpenAI通过ChatGPT和InstructGPT证明了GPT可能是更理想的一个大语言模型。
第二类是吃瓜群众,可能都不知道什么是Bert,只知道ChatGPT,并且认为这代表了人工智能的未来。
甲小姐:为什么现在想要做大模型的都纷纷表示“太缺人了”?
张斯成:可能是因为过去几年国内做生成式AI的公司,90%都在使用Bert路线。当时GPT表现出来的实用性比较低,性价比方面难以满足项目类的需求。或许,国内的创业环境一直都逼着大家不得不考虑短期的功利性。
甲小姐:听说云知声的黄伟之前认真比较过GPT和Bert,但选了Bert。
张斯成:但据说他们在看到instructGPT之后就开始切换到GPT路线了,在业内而言动作还是相当快的。现在有一种设想是用SparseGPT来进行压缩,可以在保持精确度的情况下显著降低训练成本,降低对算力的需求。
另外,据说还有一些学者从基础设施入手,提出不用GPU,比如英伟达的A100或H100,而是使用云计算的常规算力来进行训练。这个理论上似乎是有一定机会,只能等几大云平台公司来实现了。
甲小姐:ChatGPT的社会价值是什么?
张斯成:ChatGPT是一次大型社会化实验。这是OpenAI对GPT模型的压力测试,让全社会一起用,来测试模型的通用性,这样才能够对微软承诺,产品已经达到商用性能。
我相信AGI肯定会带来一次深刻的革命,不亚于工业革命,但ChatGPT还没到这个程度。如果要类比的话,我认为ChatGPT的影响类似iPhone诞生。iPhone带来的最大变革就是把按键输入变为触屏,这是一次人机交互的变革,导致很多人开始思考自己工作生活各方面的变化,由此带来了整个移动互联网时代。这是一种遍布社会各个角落的自激反应。
我认为现在还没到互联网寿终正寝的时候。ChatGPT可能会带来新一代互联网,我个人称之为“智能互联网”。这代互联网最根本的特点,是Bot将成为人机之间最基本触面,不再是App,也不是Browser。
这种变化将引发众多场景的范式迁移,甚至进而影响互联网的经典架构。
ChatGPT的爆火,实际上是一场普遍的社会心智教育,可能会带来三重影响:第一,AI是一种基础能力,人们要考虑如何更好地利用它来提升自己的综合能力;第二,AI能力的提升可能会重构我们日常生活的范式,我们要用新的方式来解决原有的场景难题;第三,可能会带来更多微创新,让某些场景从原来的想象变成现实。
对于我们这几代人而言:“抢走你工作的从不是AI,而是其他掌握AI工具的人。”而对于之后几代人来说:“区别你和AI的从不是人性,而是对星辰大海的向往。”
张斯成:如果纯粹做2C的业务,是没有壁垒的,就是要快。
现在大环境已经变了,2C类的创业公司干到一定的程度只有两条出路,要么被人碾压,要么被人收购。如果问现在还能不能搞出一个滴滴?我认为没机会了。在国内目前的平台格局中,C端场景几乎没法独立跑出来。因为巨头都在背后,基本是蓄势待发且虎视眈眈,一旦某个领域的PMF被验证,就能够直接以他们的资源和用户快速碾压初创公司。
甲小姐:当时滴滴能出头但现在没机会的核心变量是什么?
张斯成:当时滴滴快的开始的时候,巨头内部也不确定该不该下场做,而且当时可以做的业务机会非常多,它们甚至都无法抽身来投入出行领域。但现在巨头普遍处于机会匮乏和饥渴的状态,一旦开始互卷,创业公司几乎没有胜算。
甲小姐:如果现在有一家初创公司还想做C端,它的机会是什么?
张斯成:如果要做C端,就做国际市场。如果要在中国做,就做B端。
甲小姐:国际市场也会面临巨头厮杀。
张斯成:但国际市场足够大,国际上的巨头基本会比较包容,如果哪家创业公司做得不错,他可能直接收购,而不会用自己的体量把它碾死,这是国内外创业生态的不同。
所以选择2C领域的创业公司只能靠速度,在夹缝中迅速推出爆款产品,以忠诚用户的体量来形成护城河,否则很可能帅不过三秒就被巨头碾压了。但2B领域还是有很多机会的,从过去十年云计算/SaaS的发展历程看,大平台也很难靠规模化来席卷企业服务领域,因为这是一个为差异化付费的市场。
甲小姐:你认为国内现在对ChatGPT还有哪些待解的命题?
另一个比较大的未知因素是:国家到底会如何监管?
ChatGPT这类产品,从知识属性上看是一个认知教育工具,对内是教育,对外是认知作战,到处都有价值观的痕迹。在某种程度上,OpenAI的ChatGPT,和好莱坞的电影工厂起到了类似的作用,有意或无意中传播了西方的价值观。因为训练模型时使用的语料分布在很大程度上就决定了它输出内容的倾向。
目前为止,LLMs(大语言模型)的机理依然是黑盒子,我们也无法通过调参来确保它的输出是符合认知教育所要求的。在这种不确定性下,结合对社会性数据安全的考量,我估计中西方之间未来大概率会“划洋而治”,各自扶持ChatGPT类的产品。
甲小姐:你认为此时此刻市场对ChatGPT的认知存在某些普遍的误区吗?
张斯成:现在很难判断对和错,但比较明显的误区有两个:
其次,我认为当下某些观点狂热过头了。ChatGPT爆红之后,这类AI技术的确会改变很多生产关系,持续引发一系列的场景升级,但它本质上并没有将生产力提高量级的能力,离“工业革命”带来的震撼还很远,因此不用刻意鼓吹。
人类离AGI(通用人工智能)的实现恐怕还有相当长的一段距离,ChatGPT只是隐约间为黑暗中前行的人类投来了一道曙光。过去十年的经验证明,很多创新是经不起鼓吹的,开始有多狂热,最后就有多少一地鸡毛。例如区块链、加密货币、Web3.0几乎都是这样,如果最初让他们安静地发展,反而有可能展现出真正的价值。
我个人相信AGI的时代一定会到来,但这中间可能还需要经历50甚至100年,我们这代人能不能看到需要打个问号。所以现阶段不要神化ChatGPT。神化一个事物会往往会带来恐惧,这种恐惧对于创新的发展来说是不利的。我们要有信仰,我们更需要朝着信仰奋斗的土壤。
甲小姐:我一直认为试错和犯错是两件事。科技创新本身需要试错,比如OpenAI在窗口期做了这个大规模的社会实验。但如果我们在试错阶段就把它摁住,把试错当犯错,无法进行社会数据的采集和社会实验,我们的差距可能越拉越大。
张斯成:你说得非常正确。某种程度上,过早过严的监管很可能会遏制创新。我们可以表达乐观,但不要神化它,也不要丑化它。ChatGPT归根到底还是在AI大范畴下的,它如何创造更高的生产效率,帮助国家发展经济,帮助百姓提高生活体验,这是关键所在。
快报
16:01
欧股集体走低,欧洲斯托克50指数跌0.30%
15:58
印度NIFTY50指数上涨1%
15:52
CPTPP成员国是否审议中国加入?外交部:与各方保持着接触、沟通和磋商
15:46
天原股份:昌能煤矿暂停试生产
15:45
优衣库董事长称没有使用新疆棉,外交部回应
15:44
亚太药业:注射用泮托拉唑钠通过仿制药一致性评价
美得州州长连发3项“反华”行政令,外交部驳斥:停止对中国无端指责抹黑
15:41
思维列控:收到全资子公司蓝信科技分红款3300万元
奥乐齐在无锡成立商业公司注册资本2000万
15:39
威龙股份:控股股东拟1000万元-2000万元增持公司股份
15:33
汇顶科技:筹划发行股份及支付现金购买资产并募集配套资金
15:30
韩国首次批准使用基于人工智能编写的数字教科书
15:29
美元兑日元USD/JPY日内走低1.00%,现报149.67
A股再现月末上涨规律,人形机器人、互联网电商、大消费、软件开发等普遍上涨
15:24
东吴证券:维持贵州茅台“买入”评级,预计今年将稳健保障经营计划顺利完成
15:22
财政部同意发行“上冰雪逐梦亚冬会”等28款即开型体育彩票游戏