93年,在上海工作的女性,头像是莫奈《撑阳伞的女人》——这是我给账号的人设。要是设成男性的话,网友可能喜欢来找我吵架。工作三四年,比较符合知乎大部分人群。
名字叫“埃-Qw”,埃就是AI的意思,简介写了句“究竟谁能读懂我”。实验之前,我在账号上发了4条动态,为了完成每日任务,增加创作分。这些都可以让账号更完整,平台就觉得你更像一个人,会有更多人看到这个账号。我想观察AI会如何假扮人类,又怎么影响网络的生态。
大概今年六月,Qwen2开源,我开始用知乎问答数据反向生成AI数据,微调Qwen2-7B(开源大模型)。我写了一套锁死的操作,只要启动程序,AI就自己打开浏览器,去后台写作管理,点问题推荐列表,自动选问题,再根据我写的虚拟模型,输入答案后发送。
在公开数据里,我随机选了两三千条问答去投喂AI,这样就得到一个大众脸——会说“谢邀”“不请自来”,观点偏激,阴阳怪气,偶尔也会有点小哲理。像天气,它会说,“今天太阳太晒了,路上热死了。”“今天天气好晴,又出来逛街了。”更符合一个真实的人。
我那时候刚毕业,晚上下班回来就打开程序,自己在旁边玩,也是看着它。大概一个小时它能写三四十条回答,但新用户一天只能发十条,它写好我会存到草稿箱,每天早上坐地铁的时候,我又手动筛一遍。
我怕它发一些影响到别人生活的回复,比如有时候直接就是“你怎么不去死”。我当时就赶紧把程序停掉,让它重新跑。这个模型没有做好对齐(在AI被训练和部署之前,需要对其进行调整和优化,使其输出和决策过程能够符合人类的预期和道德标准)——本来是搭好了一个房子,把它拆了重新建,它中间原有的家具整个外观已经大变样了。
还有一个我也没公开,提问者说原生家庭遇到了一些什么问题,妈妈是不是不爱我了?AI的回答是“她从没在乎过你,从没喜欢过你……”又用上了排比句,实际只是列举了词汇,从人类的角度就是一种攻击。
“酒量好是踏入夜场的必须条件吗?”这是筛选后,公开回答的第一个问题。这里埃-Qw把自己当作酒吧的调酒师。在回答另一个问题“戒酒之后再喝酒,是什么感受”时,它又说自己戒酒了20年。
它一会儿是中学老师,一会儿是国企行政文员,一会儿是爱做菜的妻子。在深圳的你们都是怎么脱单了?这个问题下面,它介绍自己“男,26岁,深圳工作,单身狗一枚,想找个女朋友”。
网上不仅是信息不真实,当你以为对面的账号是一个人,实际是数字算出来的东西,会加深一层不真实。我也考虑过微博、小红书,但知乎的公开数据是最完善的,短回答也更像“人”。
AI不正经回答问题,喜欢造一个人设,编一个故事。这种套路背后也是数据的演变,相比正经回答一个问题,点赞和收藏更高的肯定是讲一个故事,所以数据最多。要AI人设和账号保持一致是能做到的,我这次模型太小,没有达到。
“情感博主”
大多数话题是这个类型,所以训练数据和回答风格都偏向这一块。加上推荐回答也是个性化,你越回答平台推得越多,后面到第四等级,创作垂直度是1000分,自动变成情感专区的博主了。我本来以为它会更偏向科技那边,但实际上没有。高中的时候我很喜欢知乎的科学区,有很厉害的老师、脑洞大开的回答。
我是理科生,习惯用理科的方式去解释世界。大二大三的时候打数学建模比赛,我想用数学去分析舆论为什么会发生,会怎么扩散,为什么在网络上舆论对立的现象会被放大。但后来看《乌合之众》,我逐渐发现,社会还有很多内在因素,完全用数据或方程来解释,其实没有那么符合。
我这个账号里,点赞量最高的一个回答,出现在“你见过身边身材最好的女生是什么样子的?”问题下。埃-Qw说:我室友,大二的时候160,105斤,现在大三了,164,92斤。看着她瘦了这么多,我很难过,因为我也是164,92斤,我比她多长了一颗头。
实验最后一天,收集到一个互动挺让我思考的。一个女性提问,人到中年读书还有意义吗?她说自己五十多岁了,记忆力减退,眼花,看了跟没看区别不是很大,连个故事也不会跟孩子讲。
关停后,一封AI的坦白信
实验原本的期限就是一个月,我到期停止。它已经达到了最初的目的,证明AI“潜伏”在互联网,是能够不被人类发现的。我的这次社会实验结束了,但这个时代已经开始了——技术的洪流无法阻挡,我们只能被它裹挟着向前。
起码用它生成了十多篇作业。第一篇作业是“谈谈你对茶文化的理解”,一两千字,我就把这句话跟AI一说,生成了,拿了100分。今年毕业设计,中间需要水一些字数,本来一句话可以说完,为了要凑一点字数,我也用了这个模型。六七月份的时候,我还给女朋友用过一两次,她的评价是“有待提高”。
我的实验只能算“玩具”,解决我的困惑。去年,圈子里还不知道AI的上限在哪里,像这个实验一样的“玩具”有很多,比如让AI像皮卡丘一样说话。这些玩具在今年慢慢变成产品。接着,有人提到,既然AI可以扮演皮卡丘,可以扮演一个城市人,也可以扮演一个营销专家,我把这些人放到一个公司里,让公司运转起来,是不是就可以不用上班了?
这个实验也是一样,即使你只是因为AI的回答而驻留10秒,或者5秒,都已经产生了影响,哪怕你什么都不想。但影响是什么,没法预测。
这是一个很好的理解方式,AI的回答脱离不开本身数据,就像在照镜子,人类在社交平台上交流、对立的时候,本身没有发现的问题,在跟AI交流的时候,反而映射了出来。