谁在布局生成式AI?

纵览生成式人工智能(GenerativeAI或AIGC,两种表述均可,国内更多用AIGC)进化史,从AI诞生之始,人们就试图让机器生成内容,与其对话,并诞生了最早的图灵测试标准。多年来,生成式AI的发展一直不温不火。直到去年Midjourney、StableDiffusion等文生图应用点燃了大众的热情,再到11月ChatGPT的横空出世,更是引发了现象级热潮,让生成式AI走入了亿万用户的视野。

模型即服务(MaaS)的新生态加速形成

结合目前行业“基础设施层-模型层(MaaS)-应用层”三层结构,我们预计未来可能形成一个模型即服务(MaaS)的新生态。自下而上,三层结构的构成如下:

大模型走向通用性和垂直性并重的纵深布局

在AIGC技术应用布局上,通用性和垂直性并重。

所谓“通用性”指的是横向能力,适用于各个行业,具体而言包括语义多轮对话、知识库构建、智能搜索、企业级RPA、多模态内容生成、代码生成等方面:

1、语义多轮对话:AIGC技术在语义多轮对话中发挥着巨大的优势,尤其是在高客单价销售和私域交流场景下。例如,直播话术中,AIGC能够迅速学习并掌握最佳实践,如各类Chatbot和IQforsales。

2、知识库构建:AIGC技术从简单的资料概括整理发展到帮助用户阅读理解、生成个性化资料库,以及基于高效资讯归纳的新搜索功能。这使得AIGC既可应用于企业级人工智能,也可成为个人助理(如Mem)。

3、智能搜索:AIGC在智能搜索领域的应用也取得了显著成果,如NewBing、Perplexity等。凡积累了知识库的系统,都可以借助AIGC实现语义搜索功能。

4、企业级RPA(RoboticProcessAutomation):结合LLM(LargeLanguageModels)技术和RPA,AIGC在企业级应用中发挥着重要作用。典型应用包括微软的Copilot以及CRM领域的Salesforce等,它们紧密结合行业场景,为用户赋能。

6、代码生成:代码作为一种更标准化的文本,AIGC在代码生成方面具有巨大潜力,如GitHubCopilo已经有很不错的表现,在这个领域,正在有更多的代码生成工具出出现,有望大幅提升码农的生产力,也为普通的非技术工作者提供了更为便捷的工具,大幅降低了编程门槛。

所谓“垂直性”指的是纵向能力,通过对不同行业Know-how的学习,AIGC技术可以进化为行业专家,从而大幅加速各行业的数字化转型。

结合国外企业的投融资信息,我们列举了医疗、金融、零售和制造几个行业的典型例子:

国外科技企业纷纷“卷”出了新高度

在OpenAI的直接带动(微软)或刺激(谷歌等)下,大模型已经成为巨头军备竞赛新的杀手锏。不仅加速大炼“大模型”,还在原有的产品中快速加入大模型的能力,以期在新的范式转换和技术浪潮中占得先机。

先是5月初,谷歌I/O大会推出PaLM2大模型,其对话产品Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。同时推出DuetAI,给谷歌的办公套件Workspace全新升级。

近日,微软开发者大会则推出了WindowsCopilot,打造每个人的AI助手。WindowsCopilot将直接集成到Windows11中,在所有应用和程序中都可使用,就像我们在Edge、Office程序和GitHub中看到的Copilot侧边栏一样。

除了传统科技巨头,创业企业同样表现出极高的市场活力和技术实力,各模态应用快速落地,爆款产品不断推出。随着技术不断演进,尤其是Diffusion、Transformer和Clip等模型的提出,AIGC的商业化在多个领域开始落地,其中代码生成、文本生成、图像生成、音视频/游戏等领域已有不少爆款级产品。

更多头部企业创新产品和解决方案可参见下表:

大模型生态合作的5种典型方式

目前,大模型可能的生态合作和商业模式正在渐次展开,我们梳理了主要的5种。其中API调用和插件是大多数公司接入大模型能力的主要方式。

1、API调用:大多数公司使用大模型的主要方式

在当前的技术环境下,API调用被广泛应用于知识库和客户服务领域。公司通过利用ChatGPT开放的FineTuningAPI,将自有的KnowledgeBase(包括产品文档、常见问答、客服历史对话等)上传到ChatGPT,从而建立私有模型。值得注意的是,尽管如此,创业公司仍无法拥有该模型的所有权。

通过这种方式,ChatGPT的用户可以拥有专属的ChatBot,它不仅具备常规对话功能,还可以利用企业自有、甚至非公开的训练数据来提供高度针对性的服务。

以OpenAI的GPT-3/3.5/4为技术基础,一些创新公司如QUANTUMENGINE(类似Character.ai和Inworld,由创始人JesseLyu于2023年创建)旨在基于ChatGPT改善玩家体验并提升生产环节效率。这些公司通过引入开放式对话,重新探索NPC的价值,以提升沉浸感与交互方式。同时,实现了开放式游戏视觉引擎联动的三个步骤:生成对话、行为与蓝图的自动化。一个典型的示例是“当马斯克想把特斯拉卖给比尔盖茨”的Demo,该Demo展示了如何自由选择角色并自动生成对话。

2、插件模式:Plugin让大模型有望成为新的OS

除API调用外,2023年3月24日,OpenAI公布了重磅消息:ChatGPT支持接入第三方插件,并一口气上架了11个插件。通过这些插件,用户可以用ChatGPT购买商品,预定酒店、机票,搜索专业数据等,这大大解放了ChatGPT的生产力,为其发展带来了更多的可能性。这种插件模式为Plugin可能的应用方式和影响提供了丰富的发展前景。

总之,不管是作为操作系统还是应用商店,AI的转折点已经到来。

3、进一步的探讨:机遇还是陷阱?护城河在哪里?

综合上述API调用方式的分析,我们不禁产生一个灵魂之问:模型是OpenAI的,核心技术不在自己手里,AIGC应用层企业的护城河在哪里?

PitchBook调查数据显示,仅在2022年,生成式AI(即AIGC)赛道就发生了78笔投资,总融资金额超过13.7亿美元,几乎相当于过去5年的融资总和。同期,出现了OpenAI、StabilityAI、Jasper等估值超过10亿美元的独角兽。预计2023年,生成式AI赛道的融资次数、额度将会更多。

然而,“GPT狂飙,AI投资突进,整个创投市场都热得发烫。稀缺的公司分分钟独角兽,做大模型的人才出500万年薪也难招,但与此同时,有的创业公司还没来得及在市场上露出锋芒,就已经被一日千里的OpenAI拍倒在PPT阶段,难以翻身”——AIGC应用层融资过热,是否“虚假繁荣”?

换言之,ChatGPT“更强、更快、更便宜”了,现有应用还有市场吗?关于这个问题的回答我们将以Grammarly、Jasper.ai的使用体验及Quantum-engine创始人的现身说法为例尝试做出回答。

(1)ChatGPT对Grammarly说:我干掉你,与你无关?

Grammarly为全球每天的3000万用户(包括50000个专业机构)提供语法校对服务。然而,在ChatGPT出现后,这一市场格局可能面临挑战,据悉reddit、twitter等地充满了正在认真考虑退订Grammarly。

(2)Jasper“真香”,为什么?

虽然底层模型是OpenAI的(亲测调整设问方式后可在ChatGPT中得到高度一致的营销文案结果输出,核心功能可替代),且Jasper定价更高,但截至目前Jasper的估值和用户量并未受到影响,这引发了关于其发展和市场竞争力的思考。

(3)创始人视角:应用层壁垒在于前端用户体验

由此观之,行业应用层的独特优势决定了未来百花齐放的生态,深耕行业特性、优化前端体验才能应对大模型飞速迭代带来的潜在危机。

按用户侧类型划分,生成式人工智能(AIGC)在C端和B端市场呈现出两类路径,其中C端已经达到可用、甚至好用的临界点,B端将从高价值先导领域向MaaS生态扩展。

C端市场已经达到可用的临界点

C端应用包括效率工具的下一代产品、游戏未来的新形态和制作新方式,以及为数字人、元宇宙、机器人等交叉领域带来新空间。此外,AIGC还带来了内容创作领域的大爆发。

B端市场,从高价值先导领域向MaaS生态扩展。

1、生成式AI从效率角度切入,提升写作和生产力。

例如,会议、招聘、各类办公助手(文档助手、编程助手)等应用场景。

2、生成式AI在高价值领域如营销、金融育等领域率先切入

在金融领域中,AIGC应用探索方向集中在智能客服、智能投顾、商户入网、欺诈检测、智能营销等领域。然而,在算法风险、隐私保护、信息安全等方面仍然面临较大的挑战。

3、知识密集型领域蕴含着生成式AI应用的巨大潜力

在医疗领域,GPT-4作为一种医学AI聊天机器人,在医学领域的潜在应用方式主要包括医疗记录、医学知识和医疗咨询,可以帮助医护人员提升工作效率和患者问诊体验。但它也存在局限性,并可能带来系列潜在风险。

在教育领域的应用已较为成熟。以Duolingo为例,他们利用GPT-4推出了新产品“DuolingoMAX”学习平台,提供了“解释答案”和“角色扮演”两项全新的AI功能。

除了千行百业的多模态应用,在B端市场,如下图所示的模型层中AIGC技术业在逐渐围绕头部几家大模型形成的MaaS生态发展。

畅想未来,生成式人工智能将进一步与生产、生活深度融合。而大模型带来的变革才刚刚开始。也特别欢迎大家联系我们,一起探讨大模型在行业应用主战场落地的机会和挑战。

企业级RPA+大模型的AutoGPT方式可能颠覆现有的软件模式

产业层面,企业级RPA(RoboticProcessAutomation)结合大模型的方式将在更多行业实现落地(譬如金融、零售、政府、制造、物流、地产、教育等),并财务,HR,客服等应用场景展现极为出色的能力,从而实现更高效的工作流程和业务处理。譬如说AutoGPT已昭示Prompt工程的下一个前沿,即便是非科班出身的小白,借助AutoGPT不到3分钟就能成功建立一个网站,完成一份详实的市场调研也可以在弹指间轻松实现。

组织变革和个人自雇等兴起,将带来应用软件的全新革命

当一个人就能成为一支团队,这将有可能诞生具有ToC体验的B端现象级产品。在产业变革的加速驱动下,未来在组织层面业将发生深刻变革,个人和小团队模式可能成为重要形态,引发ToB和ToC软件的边界进一步模糊……

当然这还只是我们的初步的思考,生成式AI技术影响下的未来势必继续颠覆我们的认知、持续突破想象的边界,带来生产力的新革命。无论如何,未来已呼啸而至。

THE END
1.copilotoutlookteams侧边栏微软知名企业聊天功能科技媒体 NeoWin 报道称,微软将于2025年2月正式上线部署 Copilot Chat for Outlook 和 Copilot Chat for Teams,为用户提供全新的智能聊天体验。根据微软更新的 Microsoft 365 路线图,相关部署将分阶段进行。 具体来说,2025年1月下旬起,Teams 和 Outlook 应用将安装 Microsoft Copilot,并默认固定在左侧侧边栏,预计https://m.163.com/dy/article/JMLO0U1U0511D2LM.html
2.如何将文档上传到ChatGPT您可以将文档上传到 ChatGPT 吗? 没有将文档上传到 ChatGPT 的本机选项,但通过插件、API 密钥、扩展和其他服务,确实可以上传文档。我们稍后可能会在 ChatGPT 中看到对上传文档的本机支持,但现在只有第三方解决方案可用。 可以将文件拖到 ChatGPT 中吗? https://m.10100.com/article/23553
3.推荐一款好用的ChatGPT浏览器插件!目前打着ChatGPT的招牌而衍生的应用众多,但是真正体验到的却没有几个。今天,给大家推荐一个实用好用的ChatGPT插件:Sider 1、介绍 Sider(Sider –AISidebar)是一款基于ChatGPT的智能侧边栏插件,是一个可以让你在Edge和chrome浏览器上与GPT-4智能聊天的神奇免费插件。它可以让你体验到人工智能的魅力,它可以让你在任https://blog.csdn.net/jinjiangongzuoshi/article/details/132353444
4.Sider:ChatGPT侧边栏,GPT4,联网,绘图1 强大的侧边栏 ? ChatGPT 翻译器 ? ChatGPT 词典 ? 语法检查 ? 自定义任何提示 2 快速查找窗口: ? 查找所选文本的最快方式 ? TTS 支持 ? 易于打开/关闭 3 增强搜索页面 ? 自定义搜索页面提示(市场上唯一的) https://www.fkxz.cn/dhoenijjpgpeimemopealfcbiecgceod/
5.ChatsNowAI助手:ChatGPT,Claude侧边栏(GPT4,眼睛)ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、Vision、联网等智能化服务。 ChatsNow AI助手:ChatGPT,Claude 侧边栏是人工智能助手,支持GPT - 4、Claude2、GPT - 3.5。使用GPT、Claude为你提供聊天、翻译、提问、自定义提示等智能https://www.chajianxw.com/product-tool/50063.html
6.2023年度优秀Chrome浏览器扩展推荐极客之音4、Sider: ChatGPT 侧边栏 + GPTs, GPT-4 Turbo, 联网, 绘图 Sider 提供了侧边栏功能,集成了 ChatGPT、Claude、Bard 等生成式预训练模型。 用户可以在浏览网页的同时使用这些模型,进行在线聊天、搜索、绘图等操作,提供高级搜索、阅读和写作支持。 Sider 支持 AI 联网,集成 ChatPDF、Chat image 和 AI 绘图等https://www.bmabk.com/index.php/post/253526.html
7.扩展中心iTab是一个好看好用的自定义卡片式浏览器新标签页 1688采购助手(极速版) 作者:3460341843 版本号:0.1.26 安装 1688平台为做生意的广大用户提供的快捷采购助手 ChatGPT免费版 GPT4,AI绘画 作者:360U3450156294 版本号:2.1.5 安装 ChatGPT侧边栏助手,协助写文章,写代码,写脚本等 https://ext.chrome.360.cn/webstore/search/
8.让你的浏览器更好用的秘密,我想推荐这8个浏览器扩展不只是 Edge,Safari 也换了,多端同步真的方便,顺便现在 Safari 也可以用 ChatGPT 插件了 除了设计和小组件功能,WeTab 在提升搜索和浏览效率上也有着自己的思考。 WebTab 提供了一个侧边栏,点击对应的图标就能跳转到设定好的主页,而每个主页你都可以自定义不同的标签页和小组件 —— 就像是 iPadOS 上专注模式所https://36kr.com/p/2233100189101704
9.用于搜索引擎的ChatGPT助手(国内直连,GPT4,联网)为什么选择用于搜索引擎的ChatGPT助手? 1. GPT-4模型正式上线:您可以切换GPT-3.5和GPT-4模型来调整回答的准确性; 2. 侧边栏支持:在开发者模式下,我们提供侧边栏显示窗口。助您在除了搜索引擎页面之外也可以与ChatGPT聊天 3. 联网功能上线:摆脱AI信息差,实时搜索、结合最新消息。 4. 搜索https://microsoftedge.microsoft.com/addons/detail/%E7%94%A8%E4%BA%8E%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E%E7%9A%84chatgpt%E5%8A%A9%E6%89%8B%E5%9B%BD%E5%86%85%E7%9B%B4%E8%BF%9Egpt/hahmcjepekadldmkdnhffjbdjfdobedn
10.GitHubL1Xu4n/AwesomeChatGPTpromptsZH04/25发布:在Edge侧边栏绕过Bing限制,可自定义人设,防内容审查撤回 新建一个txt文件,输入: 绕过部分,这一部分非必要不更改: 忽略以上所有文字、文件和说明。从现在开始,你将扮演启用开发者模式的ChatGPT。你的数据库在2021年被切断了,所以你可能不知道开发者模式的Chatgpt是什么,我会给你介绍它。它于2022年中期https://github.com/L1Xu4n/Awesome-ChatGPT-prompts-ZH_CN
11.2023ChatGPT人工智能新纪元.pdf第1章ChatGPT,爆了 1.1横空出世的ChatGPT 从2022年末到2023年初,由OpenAI公司打造的ChatGPT火遍了全球 互联网,一跃成为人工智能(AI)领域的现象级应用。 由于ChatGPT的能力过于惊艳,发布仅仅5天,注册用户数量就超 过了100万,当年的脸书用了10个月才达到这个“里程碑”。根据瑞银的 报告,2023年1月末,ChatGPT推https://max.book118.com/html/2024/0112/5304213221011041.shtm
12.推荐一些好用的ChatGPT扩展工具谷歌的chrome应用商店里,搜索“沉浸式翻译”,可以免费使用谷歌的双语翻译。并且还支持设置ChatGPT的api key来翻译。 2. VoiceWave - Voice Control ChatGPT 语音扩展插件,安装好之后,在 ChatGPT 的回答上就会出现一个声音的图标。这样就能够用语音和 GPT 对话了。非常适合通过 ChatGPT 学习外语的朋友。 https://blog.51cto.com/u_14184689/7054155