10年来,社交平台的稳定格局,在通向AGI的技术变革里,正在出现改变的契机。
文|张鹏
编辑|郑玥、郑玄
连线上张璐的时候,她人正在美国。自从去年ChatGPT爆火,这位SoulAPP的创始人,往海外跑的次数多了很多。
AI浪潮会席卷千行百业,社交也不会例外。
包括海外的Meta、国内的腾讯,大型社交平台都在探索AI与社交的结合。而就像AI给了Bing挑战谷歌的机会,AI对于Soul而言也是新的机遇。
事实上,从AI推荐关系到AI辅助对话,从降低表达门槛到提升互动体验,Soul布局AI的动作并不少。包括用大模型技术重构了AI聊天助理、拟人型聊天机器人「AI苟蛋」这些产品的底层技术,并已经看到了这些对用户使用社交产品粘性的提升;此外,他们也在尝试将更多AI能力引入到产品体系之中,包括开发陪伴型AI来提升用户的游戏化社交体验、文生图\文生视频等工具降低表达门槛,以及虚拟人能力提升交互沉浸感等。
两年前,极客公园创始人张鹏与张璐进行了一次访谈,她和我们复盘了Soul是如何在这个移动互联网红利末尾的时代,找到了孤独感这个社交需求的裂缝。
这波浪潮开始时,Soul研究后决定不做基础通用大模型,他们认为科技最终会平权,不能失焦,建立用户壁垒和发挥应用场景优势是现阶段最重要的事。
率先将AI引入社交关系,Soul有机会在AI时代成为以对话为主要交互形式的新流量入口。
AI社交时代,通过AI实现关系推荐、对话辅助、表达门槛降低、社交体验提升,是AINative社交网络的关键,也是Soul的重要机遇。
对话式AI需要具备情感化的能力,会找人的情绪点,还要个性化、拟人化、多样化。
训练数据的数量和质量直接决定了垂类模型的表现、迭代速度和训练成本。
掌握海量高质量的社交数据是AI社交应用层竞争关键。
AI对话目前不能替代真人陪伴,人与人、人与智能体都可以在同一个社交世界中共存。
AI会加速游戏和社交的融合。
以下是完整对话内容,由极客公园整理。
01
ChatGPT火了以后,第一个
判断是不做基础通用大模型
张鹏:过去一年你肯定看到了大模型技术的突飞猛进,Soul这一年在忙什么?
其实,AIGC这件事我们从19年就开始做了,做了很多技术上的探索,「AI苟蛋」在OpenAI发布ChatGPT之前就在内测,3D虚拟引擎「NAWA引擎」也是在行业中比较早就推出了。
但确实大模型出来以后颠覆了很多,之前我们用stablediffusion做的东西,后来我们重新去构建新的MoE(MixtureofExperts,将多个专家模型组合起来,形成一个整体模型)。包括我们从去年开始就在海外筹备建research中心,跟最前沿的技术保持联系,招募人才。高人才密度的团队是能做出好的东西的。
张鹏:不过技术天天突飞猛进,跟上技术发展的成本也不低,现在可做的东西看起来很多,但做得很好的很少。Soul这个时候怎么思考的,做什么和不做什么?
张璐:内部其实还是很快明确了一个清晰的边界。
我们做的第一个决策,就是不做单纯搞AGI技术的公司,不去做通用大模型。我觉得科技最终会平权,我们不能失焦,放弃自己的专长,去做那些看起来很热的事。
我们定义了自己的模型,做MoE,我们的优势是数据和场景,我们有非常多的垂类场景高关联、高质量数据,有非常多的用例,也是一个有流量的入口。
技术和产品的结合可以有好的产出,不管是对用户规模、粘性,还是对收入都是有帮助的。同时我们场景用例产生的数据可以快速反馈给技术。技术最终会平权,怎样把用例跑通,建立用户经验上的壁垒,是我们认为现在最重要的事。
我的精力第一个要放在以AI新技术促进Soul的主站增长上,包括拓展用户规模、粘性以及商业化的机会,肯定是要做的。第二个,用户流量入口很值得去探索。现在,ChatGPT的APP端DAU(日活用户数)应该也只有千万量级,还远远没有像当年浏览器那么的普适。
所以拥有流量入口也是一个关键,而Soul具备这个潜在条件,并且有机会在未来AI时代成为以对话为主要交互形式的流量入口。特别是我们拥有距离年轻人最近的流量入口。目前在我们的月活用户中,近八成是Z世代,在年轻人中渗透非常高,这些年轻人伴随着移动互联网发展成长,是最容易成为AI原住民的群体。
张鹏:目前哪些自己的AI产品或者功能给你们加用户粘性、加时长,或者有明显拉新效果好的东西吗?
张璐:我们其实落地了不少AI应用场景,包括了AI优化社交和内容链路,人与AI互动、虚拟人等等。目前看,从交互本身出发的新场景或功能大多都会有不错的效果。
比如我们站内在沟通场景中内测了AI辅助聊天的功能,已经很明显地增加了人和人之间聊天的轮次,这对我们有很重要的价值。
我其实不是很支持做看起来热闹的工具,工具属性的东西会拉来一些新用户,但是他要留存下来才行。如果用户「用完即走」是不行的。
张鹏:你觉得用户有可能为这些付费吗?
张璐:现在用户基本都是免费用。确实成本会比较高,特别是AI辅助聊天我们会提供多个对话灵感提示,一次3个,可以换3次,就是9个。
这个对用户粘性和留存上涨有效果,用户会为好的体验买单,比如一位用户聊天时原来的回复率是0%,然后用了AI辅助提示以后是100%,那他肯定会买。
所以现在的核心还是要搞清楚一些东西,比如用户使用AI的核心需求是什么?他们怎么去使用?我觉得用户获得AI提供的价值,这是是比较普适的需求。只是现在因为技术和产品的问题,有些人会用,有些人不会用。不用的其实是他不知道怎么玩,不知道怎么去提示这个AI。所以在设计、优化产品的过程中可能需要尽可能考虑更多人的需求,以及怎么让他能够快速上手。
张鹏:泛化具体是指?
张璐:一开始大家就是有想表达的东西、想找个地方说说话,有人能即时回应,后面用户停留在这个平台后,肯定会有更多的需求被发现挖掘,要看这些需求是什么,怎么去承接。比如说大家认识了新朋友,想一起看剧吐槽,想一起玩文字推理游戏,或者一对多AI互动……这些都是很好的方向。
未来可能是多个AI服务一个人,充分实现「以我为主」的体验,最大程度实现需求满足和情绪价值反馈。
02
数据、场景和用户,
还是做AI应用的壁垒
张鹏:你说不花精力在基础的通用大模型上去做OpenAI的事,那精力肯定在探索这种新的产品形态、应用形态,你们都做了什么?
张璐:其实我们2016年上线的时候,就在推进Soul灵犀引擎,通过算法挖掘有效特征,重构用户画像,做好人与人、人与内容的实时匹配。我们的自研垂类语言大模型SoulX在2023年推出。
张鹏:你们的尝试都是基于自己的MoE在做吗?以及这些尝试的开发方向是怎么诞生的?
张璐:对,在对话方面,我们有SoulX大模型,是完全内部自研的技术,在语音合成、视觉生成、3D虚拟人方面,也都有技术团队在做一些东西。对比行业来看,我们现在在MoE上也是比较领先的,基本上是咬住的状态。
我们团队经常聚在一起头脑风暴,我们清楚我们擅长的领域是什么,不断去讨论、验证需求是否存在,然后预估项目的成本和效益,再做出决策。
我们不赛代码,不是每个人都独立完成一个项目。在组织上,我们内部的结构是前台、中台和后台,产运是非常小的团队。比如说我们新上线的一个AI互动产品只配置了1.5个产品经理,其实是非常轻的,效率非常高,也让我们有更多试错的机会。
我们可以在主站多尝试,需求一旦通过就可以先上线实验,这点我们和字节比较像。在主站尝试后,如果发现某个点有潜力,我们就可以单独推出扩大。这些尝试之后会对用户需求有更多的理解,更能了解怎么优化模型,也知道了需要什么样的团队。
张鹏:那这些热身阶段尝试有什么收获?
张璐:一个是智能推荐方面,以AI辅助社交,真正的提升交互效率和质量。
我们上线后比较早推出的是实现智能推荐的灵犀引擎,虽然一开始,受限于当时AI的整体技术能力,推荐算法对语义的理解还没有达到一个很理想高度,挖掘、分析的数据颗粒度比较粗,但很多用户因为这个智能推荐系统,实现了即时的交流互动,快速找到了聊得来的人,站内点对点的聊天比例和对话轮数增长得非常快。可以说,这是我们平台形成高粘性、高活跃生态的重要因素之一。
我们每个聊天的日活用户,平均每天发出约70条点对点私聊消息,大部分都是生活化、趣味化的内容,这个数据里面还不包含群聊或实时互动场景。
这其实在社交行业里是非常难得的数据,可能比关联了办公、现实关系场景的即时通讯工具还要高,而且从我们站内的最新数据来看,这些关键指标都还在增长。
在AI辅助对话方面,我们的「AI聊天助理」,用AI辅助真人之间的对话。它通过阅读上下文,然后回复建议,你可以选发哪句话,不用打字了,降低沟通成本,辅助聊天。从目前站内情况来看有非常不错的使用数据,因为它特别适合我们这种开放式、多场景互动的社交产品。
在以AI结合游戏机制创新、实现互动体验提升方面,也有一些尝试。比如Agents陪你玩狼人杀,能给到很趣味的交互,AI有不同音色,能角色扮演,很像真人玩家了,很能推理,伪装、悍跳、互踩这些都能做到。具体的功能预计近期就会开启内测,可以期待一下。如果后续叠加上虚拟人效果,肯定会更好。
从AI推荐关系到AI辅助对话、降低表达门槛,提升互动体验,我们希望成为以AIGC打通整个社交全链路的AINative社交网络。
张鹏:所以从你的视角来看,你们对技术能力是能跟得上的,但真正的优势是利用场景和用户优势,做更快速的闭环的探索?
张璐:其实都知道用户的反馈对于模型的改进至关重要,我们的模型有天然场景可以得到了海量用户反馈。
这些都是非常高质量的社交数据。目前的模型训练需要的并不只是海量的数据,而是海量的高关联、高质量的数据,这直接决定了垂类模型的表现、迭代速度和训练成本。很多平台推出自研模型表现不好,就是因为欠缺了重要的数据源,这也是为什么马斯克会禁止其他科技巨头使用X的数据训练大模型,以及为什么谷歌等科技巨头也会寻求与Reddit这些社交平台合作的原因。
Soul主要的优势就在这里,我们已经上线7年多了,在年轻群体中有很高的渗透,也有高活跃、高粘性生态,一对多、多对多等大量公域社交场景下沉淀了海量的高质量社交数据,例如,目前我们有非常多的用户交互数据,一年新内容瞬间发布条数就超过6亿。除了国民级的社交平台,我们所拥有的多元、丰富、高质的社交资产,也是目前社交行业甚至中文互联网领域少有的。而且我们有C端场景,可以持续拥有高质量的用户数据反馈。
但是,如果没有C端场景,就只能进行一些数据标注,非常受限。比如一个人一天可能只能「标注」80条数据,但如果有1000万DAU,那么一天就可以通过用户反馈「标注」8亿条数据。
国内公司很可能挑战就在训练方面的能力和构建数据的能力。但就MoE而言,其实很简单,只要有高质量的数据集和用户反馈,你肯定会做得越来越好。
张鹏:AI帮人干事和解决情感陪伴分别是不同的难度,社交网络里,是不是就需要一个情商非常高的模型技术作为一个基础才能实现?
张璐:是的,这个模型需要情感化,而不只是提升效率的工具。需要是情感化方向的,能找你的情绪价值点;也需要具备个性化,需要展现出不同的性格特征,有时候应该顺应你,有时候应该拒绝你。这是适合社交场景的底层AI能力,Soul的对话式AI也是这个方向的。
张鹏:你们聊天机器人是多模态的,目前看就用户在这方面的对哪些模态的反馈整体比较好,文字还是占比最多的吗?声音的需求呢?
张璐:我认为所有这些因素都是相互结合的,只要能够做得更好,产品体验就会更好。
大致的逻辑方向是,产品有一个文字对话的基础得分,做得很好就可以得到六七十分。如果基础得分不好,即使声音做得再好,图片理解方面再出色也不行。确定拿到基础得分后,接下来就是不断迭代,做好多模态争取更好的表现。
我们现在在优化SoulX模型升级对话能力外,声音系统这些也还在不断做优化,月底之前会有一个非常好的效果,特别是在AI生成真实生活场景语音实时对话方面,表现会很不错。
张鹏:那基础能力之后,语音是不是下一个很重要的一个点?
张璐:是一个相对重要的点,可能会占30分。语音其实有很多人在做的,有非常多的解决方案,我们会聚焦在AI语音赋能「温度」和「陪伴感」方向,因为社交互动本质上是情感的流动。
张鹏:我们已经推出的和测试过的功能里,有没有你觉得比较好的进展?
张璐:在优化交互效率和交互体验的功能探索上,我们目前有一些比较不错的进展。
从我们后台的数据来看,苟蛋的对话轮数是非常高的,用户平均每天会给苟蛋发送超过70条消息,互动平均时长超过30分钟。这其实已经意味着很多用户把苟蛋当做了可以持续互动聊天的「伙伴」。
第二个是我们有一个AI互动的产品,有些类似CharacterAI,它也有非常高的对话轮数。这个场景可以UGC创作,里面有成千上万的Agents可以选择互动,整体每轮的对话数是很高的。
张鹏:提升了跟用户交互产品的对话轮次,是比较明显的收获吗?
张璐:提升用户回复率、对话轮次、内容发布率,这些数据本质还是对AI辅助人与人交互效率、交互体验效果提升的数据反馈,能比较快速的帮助我们找到方向。
03
大模型带来
哪些新的应用机会?
张璐:现在确实很多尝试都非常具有启发意义。比如妙鸭相机就非常好的实现了一种效率的提升。然后也在期待视频方面出来很好C端产品。
张鹏:你认为AI会如何影响社交?
张璐:我认为首先是AI更好的推荐关系。如果能够做好这件事,用户粘性和用户体验都会得到提升。这需要大量的数据,以及同时在线的大量用户,例如,1亿DAU和10亿DUA量级,效果是明显不同的。就像早期我们的关系推荐引擎,表现其实并不算好,这一方面受限于当时的用户数数量,也源于社交内容的复杂性——更具有非常鲜明的生活化、兴趣化和情感化的特征,理解难度比较高;但伴随着我们用户数量的提升,和加大研发投入持续升级AI底层技术,我们关系、内容推荐效果有非常明显的跃升,比如我们用户通过推荐发生交互的比例非常高,很多用户会和其他人产生对话,每日新发帖回复率超过87%。正是能够「快速」的发现「更聊得来的人」,大家才愿意去互动。
其次是创造对话分身,利用这个分身来提高回复率,我认为这也是一种能降低表达沟通门槛、实现快速交互的社交方式。Soul的方向是,形成以AI为链接的新型开放式社交网络,实现即时的交流互动体验。
张鹏:所以未来会不会有一些新的生态商业模式?
张璐:AI可以打开商业化更多的想象。我们已经能够看到的是开放平台的天花板会非常高,就是让更多的开发者、创作者、用户一起在这个价值流动的生态中赚到钱。
比如说我们目前的头像体系中,一部分是用户生成内容(UGC),有创作能力的优质用户,也就是捏脸师可以使用我们的工具生成头像并将其出售给其他用户,从而成为生产者并获得分成。
如果使用AI技术,生产效率发生改变,也不再局限于单一的产出类型,包括且不限于音乐、表情包等,更多人参与并带来更多创意个性化服务的可能。
这些领域的收入潜力仍然很高,比如头像创作,每年都能为一些用户带来比较高的收入,我们一位捏脸师用户最高月收入是5万元,基本超过了很多白领。
关于基于创作者经济的开放生态,我们一直在推动一些项目,通过提供基础的工具和设施,让用户去发挥。
张鹏:你怎么理解CharacterAI?这种需求如果抽象地总结,是陪伴感吗?
张璐:是这个方向,但整体来看,现有技术其实还是比较难让机器实现陪伴感的。
CharacterAI主要还是能自由地去跑剧本,相当于用户能自由地在里面做梦。
从产品本身来看,我觉得它非常有启发意义,特别是用户需求理解层面的。它满足了一种游戏和阅读需求,用人机交互聊天的方式去阅读,在非常fantasy的场景,设计小情节完成有趣的交流和情绪满足。理解了这些需求之后,我们也在思考去做一个更好地满足当下用户需求的产品。
张鹏:之前咱们聊你说Soul是个游戏化的社交平台了,今天再去理解这个游戏化的社交平台,有什么新的变化吗?
张璐:我觉得更向这个方向发展了,社交会更游戏化。AINative的功能其实都是游戏化的。传统理解上游戏指的是加一些数值型的目标,广义上就是好玩的体验。
现在给体验带上规则,再带上AI辅助,就叫游戏化。比如说我们的点亮SoulMate功能(用户之间的聊天亲密度达到一定数值将点亮图标),是游戏化的,因为它有数值目标在,且它的体验就在人和人之间。
我觉得未来游戏和社交的殊途同归,大家最终都是元宇宙。在更沉浸的场景中,用户有趣味性、互动性的体验,愿意在这个社区里构建并维护关系,实现一种理想的社交、互动。
04
AI和「陪伴感」
张鹏:刚出来ChatGPT每个人都很兴奋,AI会让人效率更高,过去我们不会编程,现在我接个ChatGPT就无所不能。那么人们是不是会越来越独立,越来越不需要被连接到协作场景里,我们未来都跟AI协作了。那么人的孤独到底是增加了还是减少了?我们是因此更自由了还是更孤独了?
张璐:大模型刚出来的时候我觉得是很震惊的,AI从计算机输出,到用人类语言输出,从理解代码,到理解人类语言,输出人类语言,甚至输出图片、视频,这在历史上是一个很大的突破,特别受震撼。
不过,人们在线上空间链接后,会不会再去线下玩,我不好做判断,但是我觉得归属感是更被需要了。
这也是我们做社交的想法,就是帮助大家降低孤独感,找到归属感,提升幸福感,这样的一个愿景可能在这个时代会更被需要,也是我们现在做的一些AI原生应用的方向。所以我们在这个科技的发展时代是非常兴奋的,在做对用户真正有价值的东西。
张鹏:归属感一般怎么形成?你在做产品的时候,归属感这个词怎么被拆解?
张璐:归属感就是人在组织中的坐标和他被别人所需要的程度。
我们是在不依赖于现实关系的情况下,提供归属感的平台,就是AI推荐的社交网络。AI可以了解你的兴趣点,无论这些兴趣是否大众,它都可以根据这些特点向你推荐社交网络,从而让你产生归属感。
我们比较不同的是,是以更轻松、无压力的方式,提供了这种归属感。当下个体「原子化」趋势明显,大家的现实关系网络其实基本相对固化,且和充满压力的职场等关系绑定。我们纯粹依托AI,基于兴趣图谱去中心化的推荐关系,快速提供现实中稀缺的即时交流互动体验,并通过游戏化的方式去建立、沉淀关系,形成「以我为中心」社区和圈层,收获认同和归属。
张鹏:怎么未来理解社交网络里,面对的对象增加了AI这一个新物种时,人的变化,以及社交本身的变化?
张璐:我认为在未来,真人和Agents都将共存。从当下的技术能力来看,Agents可能暂时不会给你带来特别惊喜的体验,它更像是一个备用选择。与Agents交流的体验可能并不总是完美的,但也不会太糟糕,实现了体验的兜底。
张鹏:所以其实你的观点是:终级的满足感还是跟人,不是跟AI,是因为人会带来惊喜?
张璐:人会给你带来惊喜,人更个性化,AI就是综合数据的结果。
不过,未来人类也可以被智能化,即人类的特质可以被提炼和解释。因此,人与人、人与智能体都可以在同一个社交世界中共存。
张鹏:所以终极的乐趣是惊喜,是不确定性?
张璐:对,而且人更难预判,他不是机器计算的结果,他需要惊喜。比如说你看多了推荐以后你肯定也想探索打破你茧房的新信息,真正的满足不是可预测的满足,是惊喜。