ChatGPT与谷歌搜索孰强孰弱?谷歌搜索是否在遭遇创新者的窘境?搜索的未来走向何方?让我们直入主题——
一、ChatGPT与谷歌所搜的功能和成本对比
1.搜索与生成
跟ChatGPT相比,谷歌搜索能直接回答的问题较为有限,主要通过查找关键词,不具备语言生成和多轮对话能力,更不可能帮用户生成代码。搜索是通过索引在一个有限页面集合中检索并给予已经存在的内容,ChatGPT可以在理解语义的基础上给出答案,往往很有深度和创意。
2.个性化
谷歌搜索会基于用户的信息做出个性化筛选,因此能给出更好的结果;目前ChatGPT还没加入个性化推荐方面的功能。当然你可以把你的偏好写进提示词里,但这是很费事的,而且效果不一定好。
3.真实性
4.成本
成本是不能忽视的,目前每轮对话的成本在几美分,这非常高。谷歌目前每天85亿次搜索,如果这样的需求迁移到ChatGPT,成本要下降超过1个量级才能承受。
图源:Twitter
二、搜索的商业模式
2.竞价排名机制是创收神器
5.搜索引擎的壁垒
很多网站不愿意让谷歌和Bing以外的搜索引擎去爬信息,因此重新建立一个搜索引擎并没有那么容易。
Chrome是当前份额最大的浏览器,这是很大的优势,打开Chrome默认的搜索就是谷歌。这也是为什么谷歌每年花很大的成本在跟苹果Safari浏览器绑定,确保iPhone的默认搜索引擎是谷歌。美国司法部正在试图打破这一捆绑,我们拭目以待。
图源:statcounter
6.谷歌的搜索也在进化
谷歌针对商品搜索了做了很大力度的优化,现在美国消费者搜索商品的第一大去处是谷歌,即便亚马逊Prime会员也是先去谷歌。下图为MorganStanley对美国消费者商品搜索的调研结果。
图源:AlphaWise,摩根斯坦利
三、搜索可能的演变方式
1.短期可能是两者结合的过渡形态
比如网页的左边搜索,右边为对话机器人。下图为加入ChatGPT浏览器插件的谷歌搜索效果。
图源:谷歌
这是一种比较生硬的结合方式。有人做了更有创意的结合,比如结合你的浏览器页面发出指令。如下图所示的XP1产品,到微软CEOSatyaNadella的LinkedIn主页,给他写一封email说服他使用某款产品,这时GPT大语言模型就可以自动完成这项工作。
图源:微软CEOSatyaNadella的LinkedIn主页
Replyto[[mail.google]]basedon[[knowledgebase]]
Summarizewithbullet-points[[cnn]]
Extract[[linkedin]]experienceasCSV
Generateatwitterthreadwithemojitosell[[product]]
Generatea5sentencebioabout[[linkedin]]
……
2.会出现更多富有创意的AI与搜索结合方式
可以想见可以玩出的花样还有很多,比如这两天刚上线的基于Twitter的搜索引擎perplexity.ai。这个搜索引擎通过OpenAICodex将自然语言转化为SQL,查询Twitter的历史数据。
图源:perplexity.ai
3.基于AI对话搜索的推广,需要AI模型能力的进一步提升和成本进一步下滑
AI模型需要更大的参数量,利用更多的数据,更高的训练算力,更低的单位训练成本。可以期待OpenAIGPT-4以及其他AI研究机构的最新模型,当基础模型做得足够好,训练和部署成本足够低,ChatGPT这类应用才能真正推广起来,尽管ChatGPT引发了热潮,目前的用户量也只是在百万级别。
除了预训练大模型本身,开发人员也要在微调/prompt提示词上做更多的功课。下一代模型本身的能力可能已经足够强,但需要足够精巧的任务训练激发出模型本身的潜能。StableDiffusion要给出一个promptbook来给用户演示如何写提示词,因为很多词汇的用法是初学者想不到的。
搜索也是同理,ChatGPT对提问的理解未必达到了最佳状态,也需要我们“问对问题”,或者让它“tryagain”“继续”,才能给出想要的答案。这需要进一步的promptengineering,让模型更理解用户的问题,而不是让用户去学习模型的特点。这更多是对工程能力的考验。
OpenAI在ChatGPT中加入人类反馈的RLHF方法也值得进一步推广,这可以让模型符合人类的意图(alignment)。事实上,我认为ChatGPT的公测本身就是RLHF的一环,OpenAI从我们与ChatGPT对话中收集反馈,很多用户很有创意的提问方式是在探索模型的边界。从这个角度讲,ChatGPT从发布到现在产生的上千万美金成本是值得的。
4.谷歌是生存还是毁灭
这是经典的创新者窘境,谷歌不是没有类似的技术,比如今年早些时候发布的LaMDA对话AI,甚至让内部程序员怀疑AI已经具备自我意识。有这样的技术却不拿出来应用,我认为谷歌有三方面的担心:
一是担心AI在道德、伦理、社会等方面的冲击;
二是当前AI模型训练和部署运行的成本太高;
谷歌CEOPichai已经表态:“2023年将成为AI在对话与搜索领域的发展转折点。我们将大步前进,并推出更多新产品。”我们期待谷歌跳出它的舒适圈,积极拥抱最新AI的发展,但同样不要低估组织原有的惯性和束缚。
5.Bing的机遇
尽管搭建一个新搜索引擎是非常困难的,但微软的Bing的机会相对更大一些。近期Bing在微软的地位有所提升,微软CEO正在让Bing跟微软的其他产品做深度结合。想象一下搜索引擎Bing+最新一代大模型GPT4.0+WebGPT+ChatGPT+Azure云服务,可能诞生全新的搜索体验,毕竟微软是有钱,烧得起的。如果司法部再助推一把,让谷歌搜索和苹果浏览器解绑,Bing趁虚而入的机遇将更大。
6.无论谷歌搜索是否被取代,搜索的体验都将被重塑
从最早的门户网站,到后来搜索的崛起,到再后来的推荐算法,信息的传播从最简单的信息汇聚(门户),演化成人对信息的查找(搜索),再到信息精准的找人(推荐)。AI时代的搜索实质上是信息生成。
根据科技博客Stratechery的观点,一条信息的产生经历了创意-实现-复制-分发-消费的过程。文字书写的诞生将信息的分发与消费解绑,即故事的讲述者只要留下文字,不需要面对面讲述故事,即可传播信息。
印刷术让信息复制的边际成本大幅下降,带来了知识的广泛传播,文字、语言的标准化。互联网让信息的分发边际成本大幅下降,报纸等传统媒体被颠覆,每个人都可以几乎零成本获取海量的实时信息。最终,AIGC让创意到实现的边际成本和门槛大幅降低,我们可以通过自然语言生成优美的图片,生成关键的答案。