GPTs中间层Chatbot虚拟社交AIAgent,大模型应用最新方向解析

这期间AI如火如荼,虽然我个人感知大模型应用生态并没有太多变化,但还是想记录下近期在大模型应用现象上的观察和浅显见解。

全文8500字,enjoy~

开放以来,GPTs的创建和使用一直受到GPTPlus账户限制,近期开放的GPTStore和市场上的排行网站没有太大区别。

结合了GPTs收录网站的信息,目前的GPTs大概有如下几类。在这些方面,某些GPTs确实被定制成了好用的小工具。

不过,下面才是我想表达的核心观点:

上述网站收录了8万多个GPTs,很多需求小众、场景低频的,用户使用可能只是一时图个新鲜,缺乏持续使用动力。而真正有需求的场景(如数据分析、语言学习、图像生成、PDF阅读等)则同质化严重(大家很容易想到一块去)、竞争激烈。

此外,大多数GPTs解决的诉求离大众消费场景较远、天花板低,难以形成规模效应。

GPTs解决的问题和市面上已经在做的各类应用中AI助理形态有一定重合,而GPTs给用户的心理预期则更像是ChatGPT中即用即走的「小程序」。若面向大众消费端,创作者需要将能力进一层封装,产品形态上无法和AppStore中已经积累了更多用户的应用、更易触达用户的应用去竞争。

很难想象有多少会持续优化知识库提供优质服务。

不知道这个问题官方何时会出来解决。

除非拥有垂直领域的专业知识库和独家数据,否则Bot的制作并没有门槛。真要说体验上会有多大差异,普通大众感知不会特别强烈,也就是说大部分用户不会追求产品一定要模型达到GPT-4的能力。这就延伸出下面要说的中间层了。

降低集成难度。

中间层提供了简单的API接口,开发者可以通过这些接口轻松地将大模型能力集成到自己的产品中,不需要自己训练搭建大模型,也不需要处理与大模型交互的复杂度。

Coze还支持发布到多个平台作为Bot能力使用,这在开发者看来是非常有吸引力的一项功能

接入多个大模型,隔离大模型更新风险。

中间层可以对下游客户屏蔽大模型版本更新带来的影响,确保产品稳定性。

提供更多辅助功能。

中间层还可以提供日志、监控、数据标注等辅助功能,为开发者提供更多价值。

在Coze中可以看到公开的Bots及Bots的详细设置:

首先,填写创建Bot的简单信息,头像可以使用Coze内置的AI能力生成:

Coze中有许多已经内置好的Plugins,我在此选择Google和X两个Plugins:

按照官方建议撰写Prompt,并且在右侧对话框进行测试,我的Prompt经过了大概4-5版的迭代:

迭代记录:

设置开场白、定时任务的功能:

经过我的测试,用Coze简单定制的Bot回复效果已经比Perplexity的效果好,特别是在调用Google搜索的结果上给了我很大的惊喜:

测试一:询问24年的AI产品更新

测试二:询问MJV6版本更新的具体内容

测试三:检索X推文

在X内容的总结上,回复时好时坏,只能达到5成可用状态。出现了一些啼笑皆非的状况,比如分不清AdobeAI和人工智能AI,同样的问题过几天问返回的结果也一模一样等。我猜测这些问题是由于Coze中没法接入我的XAPIKey导致的,Prompt的方式也让我无法更准确的定义接口调用方式。

定制这个Bot的初衷是当作X趋势生成器使用的,结果无心插柳柳成荫,做成了可以白嫖无限GPT-4额度的且比Perplexity更好用的AI搜索引擎,我已经在频繁使用了。

总的来说,Coze的能力很复杂也很强大,但在深度定制Bot的能力上缺乏详细的指引,字节官方的文档虽然详细但对于多任务处理、Prompt调试等没有给出更多建议,Plugin部分的文档非技术人员看着还挺头晕的。帮助用户定制真正好用Bot,大模型和中间层都还有挺长的路要走。

该方向本质上也是「GPTs」,但是在立绘、对话沉浸感上都经过更多打磨。

观察头部产品,大部分用户的诉求围绕在下图这几个方向。

但当我翻看了小红书、贴吧,又蹲了几个国内内测产品的群后,基本上用户主动晒的内容都和荷尔蒙诉求有关。

目前虚拟陪伴产品的活跃和留存都很惊艳,但付费能力大多处于有待挖掘的状态。结合各方公布的数据,基本上目前粗略估计的情况是:头部产品日活在100万+,C.AI做到了500万+;次留基本可以做到50%以上,7留在30%上下,是非常可观的。

但目前在商业化方面,Chatbot类产品没有做得特别好。星野、Talkie模仿了乙女游戏的抽卡付费,但其付费数据的不理想可能是内容过薄导致的。和Dating产品相比,Chatbot产品刚需付费的场景少了很多,更多深度玩法还有待探索。

Replika做重虚拟角色定制过程,强调角色唯一性。

而Cai、Talike、星野、筑梦岛等一众产品则是提供众多Bot供用户选择,并支持UGC创建Bot并分发。

Aura进入后虽然只有单个角色,但支持开启多个剧本的角色扮演,并且剧本由AI生成(降低了重复性)可以体验和较长文本的对话。唯一遗憾的是剧本中的人设、名称上都没有做到统一,让用户产生割裂感,在整体体验上不如乙女游戏中的剧情解锁丰富。

长期来看,模型能力是Chatbot类产品的核心,但图片、语音等多模态内容的丰富可以在一定程度上弥补模型能力的不足。

形象

产品表现层上,除了Replika使用了3D捏人,其他产品还处在快速大批量AI图片生产的阶段。(不过就过去一年元宇宙的观察,注重3D不一定是一个好方向,迭代速度慢、开发成本高,用户手捏的效率不必切换一个Bot低,另外国外的3D人物画风总让我觉得怪怪的)毕竟是竞争激烈的2C赛道,用户非常「看脸」。

值得一提的是,爱塔的部分Bot率先使用了动图,让用户在刷feeds时的场景沉浸感更强。在Pika、SVD产品控制能力加强的趋势下,未来Chatbot立绘的动态化应该很快会被广泛采用。

语音

从表格中可以看到,最新推出的产品基本都配备了TTS能力,从数据和体验上看,语音能力能强化有助于用户留存。爱塔、星野在列表停留在某个人物时就会播放开场白,完全不需要看详细的人设就可以对人物有一定带入,美中不足的是对话时无法自动播放语音,否则体验还会更上一层楼。

以下纯属个人浅薄观点记录,不一定严谨准确,欢迎后台留言拍砖交流。

在保证模型记忆力的情况下,我认为情感陪伴类用户会在长期的筛选中选择1-3个心仪的Agent进行长期高频的沟通对话,同时会存在阶段性的替换需求(新鲜感过去了换个更好的聊)。但目前这类产品擦的倾向实在太高,未来国内监管的力度带来的影响不可知。

市场情况

总的来说,因为国内监管(对NSFW内容的限制)、国内外2C用户付费能力的差异(与其他互联网产品不同的是,大模型是有成本的,且短期内不会迅速降下来),大部分从业者应该都不太看好该方向在国内的发展。

海外AppStore中这样的虚拟18+产品已经一大把了,而国内毕竟拥有巨大的人口基数,且国内市场乙女向有《恋与制作人》《光与夜之恋》《橙光》等成功案例,加上情感陪伴底层诉求,Chatbot的国内市场还是存在的。

此外,C.AI形态的产品崛起让一部分用户涌向成本更低的AI虚拟人,极有可能会抢走一部分IM、DatingAPP的活跃和时长(至于抢走多少可能还要看该赛道产品的未来发展)但倘若IM、Dating产品做这件事,又像是搬起石头砸了自己的脚,降低了平台上真实用户的连接机会,也会对已有的产品调性社区文化产生反噬,这里我持长期观望状态。

不过也许未来有天当AI内容不再稀缺,用户反而想要回归和真人的社交关系也并非不可能。

产品规模

单纯从国内市场而言,我认为这部分产品吃的是小众垂直强诉求的用户市场,用户量天花板不会特别高(具公开资料显示,Soul、探探巅峰期日活均在大百万级别、恋与日活18年200万,独立Chatbot产品应该不会超过这个上限了),因此其不会是大公司眼里Top级别的好生意。

为什么我们会看到大厂全都往这个方向挤?

我猜想还是看中了CharacterAI为首的产品拥有可观的留存与时长。今天的2C互联网早已变成注意力的生意,除了抖音以外的头部产品无不面临数据下跌带来的焦虑感,而Chatbot可能就是一剂短期止痛药。另外一个原因就是竞争对手都在做,无论如何都要入局做主动性防御。不过大公司基本都看重已有用户盘,因此比起做独立APP,内嵌在已有产品中是更合适的形态。不过说不好未来会不会面临和OS系统厂商争抢市场的局面(这些年OS厂商在语音助手上的功夫也不是白下的,以及OS发布会也需要新的AI故事),因此如果真的想做这个方向的产品,更早出发较好。

之前也YY过,头部KOL适合用自己的IP做ChatbotIP定制,比如用户可以对李佳琦的Bot咨询护肤技巧、购买建议。至于陪伴类虚拟社交方向,估计乙女游戏已经看到了陪伴类虚拟社交产品的兴起,作为防御应该会在游戏中加入对话能力,进一步保证留存和用户时长。

在PC端,Raycast、Arc均提供了快速向ChatGPT提问的能力。

同样的,在移动端如果能做到用户在不用点击加载应用就快速唤起大模型进行对话会更好,当然这个方向我目前想到的解法都更适合OS厂商去做。

拿iOS现有的交互简单发散几个可能的方案:

方案一激进派:用户可以将桌面某一屏设置成智能助理,并可以直接对话。锁屏页面解锁,智能助理已经将新信息归纳总结,也可以进入和智能助理对话的桌面查看并快捷处理信息。

方案二保守派:桌面下滑搜索改成和智能助理对话的功能,需要了解什么直接询问智能助理即可。相比于方案一没有那么激进,更适合智能助理能力有突破但还没那么接近AGI时的方案。

准确的来说,AIAgent指的是一种智能代理系统,它接近人类的大脑,可形成记忆、达成行动规划、自动交互、主动预测。

目前AIAgent的概念在市场上并没有达成共识,存在被广泛滥用的现象(很多Chatbot应用给Bot冠以「智能体」的名称,准确地说也是对Agent的误用)

个性化:随着用户的使用越来越了解用户习惯和想法,从而作出喜好预测。

可自主完成任务:

多Agent协作:

博主@林亦LYi的《AI炒股?我开了一家员工全是AI的公司,自动帮我炒股》就在某种程度上实现了多Agent协作的能力

目前,AIAgent应用大多集中在2B场景,面向个人消费者的产品少之又少。一方面是高度智能化的Agent能力需要打磨,概念落地还有较长一段距离;一方面是AI和娱乐消费诉求的结合还几乎没有,其主要带来的是生产方式变革和效率变革。个人消费者方向,目前只看到「私人助理」场景。

23年下半年,GPT、GeminiPro在发力多模态识别、多模态输出上发力,不管是移动版ChatGPT的语音功能、Dall·E3的使用体验还是GeminiPro的宣传片都相当亮眼。此外语义理解能力极大增强未来会逐步影响到应用层,相信未来只要通过Prompt控制生成的视频、音乐效果都会逐步得到改善。

此前模型的训练数据通常是由人类描写的图像文本和图像训练而成,而人类描写的文本内容倾向于简单描述,容易忽略图像背景中的大量细节:

于是OpenAI建立了一个图像标题生成器,通过建立拥有详尽图像文本描述的数据集进行模型训练来强化模型对图像的理解能力,下图中可以看出,训练的数据包含了从互联网上抓取的选定图像标题、SSC(合成的简短标题)、DSC(合成的长标题),长标题中不仅描述了图像的主题,还描述了它的周围环境,背景,图像中的文字,风格,颜色等。而这样的数据将大量用于Dall·E3的图像生成模型训练。

甚至,可以根据视频内容写出代码:

目前,Google披露Gemini将提供三种版本,Ultra、Pro和Nano,分别适应复杂任务、广泛场景和不同设备。

Ultra版本是功能最强大的模型,能够在各种复杂任务中提供最先进的性能,包括推理和多模态任务(应该就是上述视频中展示的版本);Pro版本在成本和延迟方面进行了性能优化,提供了广泛的任务上的显著性能;Nano版本是最高效的模型,设计用于在设备上运行。训练了两个版本的Nano,分别具有1.8B(Nano-1)和3.25B(Nano-2)参数,针对低内存和高内存设备。通过从更大的Gemini模型中蒸馏来训练,并且是4位量化以便于部署。

目前Pro版本开放了API供开发者集成。

甚至还集成了一些办公场景的实用工具:

因功能全面,浏览器插件的形态使用方便,Monica受到很多用户喜欢,Chrome插件商店数据显示该插件一共有100万安装量。但由于我是在不太喜欢浏览器侧边常驻悬浮窗,在试用后就没再继续使用Monica了。

在对比了多个播客转文字的产品(飞书妙计、BiliGPT、memoAI)后,阿里出品的通义听悟无疑是体验最好的一个。其首页就突出了转录播客的功能,注册赠送10小时免费转录。

支持播客链接直接转录,准确率非常高。

此外,还能够在转录后自动生成问答回顾(很刚需,其实都免去了打开Kimi总结提问的那一步了)。选中文本,音频内容会自动定位到对应位置,基本上满足了我对播客内容转文字的所有诉求。

这是一款心情笔记APP,是目前大模型应用中能够较精准面向2C需求的产品。在已有笔记产品基础之上,心光最大的特色在于记录笔记之余提供了一系列AI能力。比如会通过AI为用户的心情笔记进行主题聚类。

首次使用心光时,用户会自定义心光中一个非常重要的水晶球AI的角色(伴侣、朋友等)。在记录日记的同时用户可以通过个性化的水晶球AI抽取塔罗牌、求夸夸,获得AI的反馈,不过实际体验感觉部分回复还有些机械和模版化。

另外,每周来信是个我非常喜欢的功能,在持续的记录后,能有一个异步的总结反馈让用户感觉非常惊喜,也能激励用户持续使用下去。

心光搭载了部分本地化AI模型,为打消用户对隐私问题的疑虑,采取了数据上传iCloud的方式进行信息存储。目前该产品在仅有两人全职的情况下发布,功能完成度非常高,但APP在表现层UI层级上处理的没有那么好,加上功能较多,有时会找不到功能、看起来装饰性的图标其实是可点击的按钮等等,使用时会一点点心理负担。

THE END
1.合肥APP开发方式的优缺点有哪些?app操作系统智能助手在移动互联网时代,APP(移动应用程序)已成为企业与用户沟通的重要桥梁。选择合适的APP开发方式,对于项目的成功至关重要。好牛软件将探讨几种主流APP开发方式的优缺点,帮助开发者更好地做出决策。 一、原生开发(Native App) 优点: 性能优越:原生APP利用操作系统提供的底层API进行开发,因此具有较高的运行效率和性能。 https://www.163.com/dy/article/JCH42LQT0538W6VD.html
2.社交APP软件开发主流技术选型分析缺点?:开发成本较高,需要针对不同平台分别开发;更新迭代速度相对较慢。 ?适用场景?:对性能和用户体验有极高要求的社交APP,如视频通话、大型游戏类社交应用。 二、跨平台开发技术 跨平台开发技术是指使用一套代码库同时为多个操作系统开发APP的方式,旨在降低开发成本和周期,提高开发效率。目前主流的跨平台开发http://www.apppark.cn/t-54395.html
3.视频社交APP开发特点及优势分析统软云APP开发APP开发视频社交APP开发特点及优势分析 人口红利为移动互联网带来增长机遇的同时,也推动了智能移动终端的普及和国内移动社交应用覆盖设备规模的逐步扩大。目前,预计覆盖10.41亿终端,包括陌生人和熟人,其中陌生人社交用户规模达到3.5亿。 视频社交应用的发展能给用户带来什么https://www.unisoft.cn/service/app/2b33a9ed2ea590b3.html
4.浅谈社交APP开发的优势和建议浅谈app浅谈社交APP开发的优势和建议 人工智能改变了人们的生活。说到社交,以前人们第一时间想到的是短信、电话,而现在有很多人工智能软件给我们使用,比如微信、微博以及社交app软件等。由于社交app的出现,满足了人们大部分的生活需求,也得到更多人的青睐。 https://blog.csdn.net/q365679085/article/details/129425391
5.Uniapp是什么?Uniapp跨平台开发框架的优势和应用嘲深度解读Uniapp开发框架具有高效开发、性能优秀、功能扩展灵活等优势。目前已被广泛应用于中小企业、电商、社交、媒体等不同行业领域的 移动应用开发中 本文带你了解,我们基于Uniapp开发框架 开发的OpenCart移动跨平台APP,向你介绍其特点、优势以及与传统开发模式差别 https://www.guangdawangluo.com/index.php/articles/325
6.移动应用开发(APP开发)市场调研报告12篇(全文)随着信息技术的不断发展, Hybrid混合开发技术得到有效应用, 促进了移动图书馆APP的诞生, 为学生们带来更多便利。Hybrid App (混合模式移动应用) 是指介于web-app、native-app这两者之间的app, 兼具“Native App良好用户交互体验的优势”和“Web App跨平台开发的优势”。https://www.99xueshu.com/w/file015bgpe9.html
7.深圳APP开发公司手机软件开发移动APP软件开发公司东方智启是专业的深圳APP开发公司,专注于移动端APP软件开发制作服务,为行业企业提供高效的手机软件开发定制,在深圳寻找APP开发公司,做电商ERP、IM即时通讯系统、O2O商业系统、移动OA办公、智能医疗系统、智能交通系统等APP开发服务找东方智启https://www.zhiqiapp.com/
8.翻译类APP开发为何能够流行起来智能手机的流行,我们很多的事情都可以通过手机完成,目前市面上的多种APP软件也应运而生,解决用户的痛点和需求;翻译类APP开发也应运而生,结合多种功能板块带给用户更多的便捷。http://www.app-dm.com/news-detail-399.html
9.交友约会app软件app定制开发采用按需软件app开发服务的优势 当您为约会交友开发软件app时,公司可以利用多种优势。下面提到其中一些: · 社交联系 · 约会软件app提供最好、最活跃的平台。在这个平台上,您可以与像他们一样的其他人分享您的感受。这将帮助许多灵魂相互联系并享受他们的关系。因此,企业需要开发一款由最新技术组成的软件app。 https://www.yanding8.com/post/1595.html
10.社交app交友app定制开发展示CH交友是一款具有自身特点和竞争优势的陌生人社交APP,产品核心就是做好搭建媒介,制造场景的事情,首页采用卡片式涉及,将用户最关心的会优先展示,提高用户体验度。 开发流程 需求评估 品牌视觉 系统开发 测试修改 上线运营 开发周期:3个月 友恋 项目简介 http://www.syikeji.com/successful/app_31_shejiaolei.html
11.快快快!荐康客上线,招募合伙人啦!央企实力,产品靠谱,营销加码将长江经济带的11个省和直辖市的优质绿色生态产品全面上线荐康客,以促进长江经济带发展的绿色创收,荐康客不同于其他电商平台的优势,荐康客是国资委严选批准的央企社交新零售的平台,且承担着两大重大的国家战略项目。 目前已上线6大类一共45款产品 已有合作伙伴 https://www.meipian.cn/2vcpvyb9
12.参考近100款案例后,我总结了这份小程序设计万字指南小程序由于依附于微信,所以我们其实只需要制作一稿设计便可适配绝大多数的手机,而不像 App 那样,需要针对不同的手机进行不同的适配。 事实上这是小程序相对于 App 的一个巨大的优势。在开发 App 时,很多企业在初创期,由于成本问题不得不选择到底是放弃Android 用户还是 IOS 用户。然而小程序只需要设计+开发一次https://www.uisdc.com/small-program-design-guide
13.什么是社交APP,如何开发社交APP社交APP开发能为用户带来什么 社交APP是一种更快速的即时通讯工具,具有零资费、跨平台沟通、显示实时输入状态等功能,与传统的短信沟通方式相比,更灵活、智能,且节省资费,它的优势是: 1、基础社交,社交最基本的需求就是可以发语音、发图片、发文字。目前的一般通讯工具APP都可以实现该功能。 https://www.jianshu.com/p/cac0d15adc8a
14.20162020年中国手机app行业市场发展趋势及投资观察咨三、发展优势因素 28 第二节 国内手机app发展规模 29 一、用户下载规模 29 二、手机app使用率 30 第三节 国内手机app管理现状 31 第四章 中国手机app行业产业链分析 32 第一节 手机app行业产业链概述 32 第二节 手机app产业链主要环节分析 33 一、手机app开发商 33 二、手机app推广渠道 33 三、手机app内https://www.bosidata.com/report/Q87504EFSF.html
15.APP定制开发天津小程序天津微商城天津爱采购定制开发类型 不需要下载安装即可使用的应用 在线客服 网站建设 SEO优化 软件开发 视频动画 微信客服 工作时间 周一至周六 :8:30-18:00 联系方式 网络推广:15122777857 视频动画:15302097857 软件开发:13389082857http://www.tjfeishang.com/col.jsp?id=134
16.APP和小程序:优势与劣势的权衡腾讯云开发者社区APP和小程序:优势与劣势的权衡 在当今数字化时代,移动应用程序(APP)和小程序已经成为我们生活中不可或缺的一部分。它们为我们提供了便捷、高效和多样化的服务,从购物、社交到工作、学习等各个领域都有涉及。然而,尽管APP和小程序为我们带来了许多好处,但在开发和使用过程中也存在一些优劣势。https://cloud.tencent.com/developer/news/1253678