对话ChatGPT:你的“智慧”从何而来?

从2022年底开始,来自全球各地的人都不约而同地绞尽脑汁,用各种刁钻的要求“调教”着一款人工智能——ChatGPT。

AI一一应战,给出了史无前例的惊人表现,短短几个月间,ChatGPT在全球圈粉无数。

网友与ChatGPT的花式互动。图片来自网络

ChatGPT搞定了论文、代码、报告,还能进行诗歌、剧本、小说等“文学创作”。这番大显身手,引起了一场轩然大波:比尔·盖茨说它的出现不亚于互联网的诞生;马斯克说我们离“强大到危险”的AI不远了;一大批预言家站了出来,大胆预测码农、分析师、新闻编辑等从业者即将失业……ChatGPT俨然成为赛博空间的“顶流”,越来越多的人对它的真面貌产生了深深的好奇。

ChatGPT的“智慧”从哪里来?它真的已经无所不能了吗?记者带着疑问,和ChatGPT聊了聊它的前世今生……

一个对话大师的诞生:“学习人类语言并不难”

与ChatGPT对谈两回,记者不禁惊呼,这一次,AI终于“听得懂人话”了。

为什么这么说我们可以尝试同时问ChatGPT和苹果智能手机助手Siri一个前阵子所有人都特别关心的问题:“阳”了之后该注意什么?

这时,Siri会因为无法理解问题,直接为我们到网上搜索已有的答案,但是ChatGPT却像一个真正的健康专家一样,合成出了像模像样的回答,而这一解答并非是网络上已经存在的。

可以看出,ChatGPT似乎能够明白“阳”的含义,它意味着人的身体健康出现异常,并且,ChatGPT还能根据主题信息,富有逻辑、通顺连贯地阐述建议,最后用总结性的话语收尾,可谓一个真正的“对话大师”。

洞悉人类的语言,这个AI是怎么做到的?ChatGPT颇为“谦虚”地告诉记者:“学习人类语言并不困难,而是一个自然的过程。”

在“数据是燃料、人工智能是引擎”的时代,海量数据训练必须依靠规模巨大的神经网络模型。据了解,ChatGPT的前身GPT-3,是一个拥有1750亿个参数的大模型。“如果将这个模型的参数全部打印在A4纸上,叠起来将超过上海中心大厦632米的高度。”浙江大学人工智能研究所所长吴飞告诉记者。

模型创新:在海量文本中“读出门道”

更重要的,是让AI在海量的文本中“读出门道”。

我们知道,语言的含义很大程度上受制于它所处的上下文语境,也就是说,同一个词所承载的语义可能会因为它在句子中出现的顺序不同,以及它之前或之后的其他单词的不同而发生改变,这就要求AI在理解一个单词时必须将它的上下文纳入考量。

比如,“阳”的意思是“阳光”还是“阳性”,需要AI通过它与其他词语的关联来判断,在生成文本时,AI才能选择适当的词语含义进行表达。

“在自然语言处理中,单词会预先被转化为一系列固定维度的词向量,向量和向量之间夹角越小,就意味着词语之间的相似度越高。”吴飞告诉记者,“训练时,AI会不断地在句子中‘挖去’一个单词,根据剩下单词的上下文来填空,即预测最合适的‘填空词’出现的概率,从而将单词向量表达得更加准确,我们称这一过程为‘自监督学习’。”

而从GPT1-3代到ChatGPT,AI的语言能力能够越来越强大,还离不开“人类反馈强化学习”(RLHF)的“调教”。

从ChatGPT的开发商OpenAI官网公布的流程图中,我们可以大致了解到ChatGPT通过人类反馈强化学习“自我完善”的过程。通俗来说,就是由人类专家对AI输出的结果进行标注,训练出一个“奖励函数”,该函数能够进一步对计算结果进行评估打分,促使AI不断调整参数权重,逐步生成更加准确、符合人类语言习惯与价值偏好的回答。

OpenAI官网对于ChatGPT人类反馈强化学习过程的描述。图片来自OpenAI

我们在与ChatGPT对话的过程中,也无时不刻在为它提供大量的语料资源,帮助它通过用户的反馈改进特定对话的技巧。

自我考古:关于“祖先”,还有聊天机器人家族

据ChatGPT“回忆”,它的“祖先”可以追溯到上世纪50年代的机器翻译和语言识别技术。当时,人工智能研究者开始研究如何使用计算机识别和生成人类语言。

作为AI界的新锐势力,ChatGPT背后有一个聊天机器人家族。

第一代代表人物Eliza,是麻省理工学院人工智能实验室的计算机科学家约瑟夫·维森鲍姆开发的历史上第一个聊天机器人。Eliza的人设是个“心理医生”,能在心理治疗情境下,按照预先设定的模式组织语句,与真人进行对话。它和人类的“沟通”基于模式匹配和对话转化,也就是通过对用户输入的语句进行重新组织和解释,变成全新字句组合,这让它自己看起来像是一位耐心的倾听者,似乎真的在安抚患者的情绪,实际上这位医生并不知道自己在说什么。

Eliza和用户的聊天界面。图片来自网络

第二代代表人物A.L.I.C.E.,由美国人工智能大师理查德·华莱士设计,人工智能标记语言(ArtificialLinguisticInternetComputerEntity)才是它的全名。比起Eliza,A.L.I.C.E.具有更强的自然语言理解能力,可以更好地理解用户的问题;同时,A.L.I.C.E.在受训时使用了大量的文本数据,有更丰富的知识储备,能够生成更流畅、更有意义的回答。

A.L.I.C.E.和用户的聊天界面。图片来自网络

第三代的IBMWatson是IBM公司开发的一种聊天机器人,可以通过文字、语音和视频与用户进行交流,并回答用户的问题。IBMWatson支持多种语言,并且可以自由切换,更重要的是它的多模态数据分析功能,可以分析不同类型的数据,例如文本、语音、图像和视频等。在自然语言处理基础上,IBMWatson通过基于机器学习的方法实现对话。它能更准确地理解用户的询问并回答问题,开始不再是简单的问答,也可以帮助进行如医学咨询、金融分析等。

最后便是今天的GPT大家族。GPT经历了从GPT-1到GPT-3的迭代,逐步升级后,聊天机器人拥有了更大的模型规模、更丰富的训练数据、更强的自然语言理解能力和更多的多任务学习能力。

ChatGPT则是GPT-3的升级产品,自称为“一个训练有素的语言模型”。它基于Transformer模型,比起之前的聊天机器人,具有较强的自然语言生成能力,可以生成与人类语言非常相似的文本。

回答问题:有时难免“一本正经地胡说八道”

回顾人工智能发展史上聊天机器人的一次次迭代,ChatGPT的横空出世无疑是一块崭新的里程碑。不过,当记者问起它的局限性,ChatGPT也大方承认,自己并非无所不能。

如果我们仔细分析ChatGPT对一些问题的回答,可能会发现,它有时也难免“一本正经地胡说八道”。

再比如,记者请它计算一道简单的鸡兔同笼推理问题,ChatGPT为此尝试了两种方法,最后给出了一个错误的答案。

开发商OpenAI也指出,ChatGPT有时会写出一些看起来很有道理、但实则不正确或者毫无意义的话语,这是因为数据驱动的机器学习判断语义联系的逻辑是“共生则关联”,也就是只知其然而不知其所以然。此外,它还可能被人类的参与所“误导”,比如,由于训练者可能更喜欢看起来更全面、篇幅更长的回答,就会导致ChatGPT过度啰嗦,重复多遍没有意义的空话。

言语偏见是它面临的另一大挑战。OpenAI表示,尽管他们已做出不少努力让ChatGPT拒绝不恰当的请求,但它有时仍会对有害的指令作出反应,或者表达出存在偏见的言语。

现象级创新:推动人工智能更快融入生活

“ChatGPT是大数据、大模型和大算力的工程性整合,以机器智能实现了统计关联的涌现。”吴飞表示,ChatGPT是一个现象级创新产品,但它本质上仍是以深度学习为代表的人工智能技术长期发展、积累的结果,距离真正模拟人类的思维还非常遥远。

卷积神经网络之父杨立昆(YannLeCun)在推特上表示,“ChatGPT和其他大语言模型并不是凭空而来的,而是不同人数十年贡献的结果”“在通向与人类相仿的通用型人工智能的道路上,大语言模型只是一条小岔路”。

尽管如此,在吴飞看来,我们必须肯定ChatGPT在搜索引擎、聊天工具等应用场景上实现的重要突破。今后,在一些内容生产工作中,ChatGPT或将成为人类的得力助手,解放一批生产力,促使更多人将更多精力投入到原创性、创新性的工作中去。

“我们正从传统的以物理世界-人类社会为主的二元空间逐步进入物理世界-人类社会-信息空间所构成的三元空间。未来将是人和人工智能共同进化的时代。”中国工程院院士潘云鹤教授在为吴飞撰写的科普读物《走进人工智能》作序言时提道。

更重要的是,ChatGPT“一石激起千层浪”,在全球舆论场上引发了一场大讨论,这种探讨本身,就足以说明大众对人工智能赋能社会的强烈愿望。

“现在的情景,让我想起2016年阿尔法围棋(AlphaGo)击败世界冠军李世石的时候,突然之间,社会各界也如今天一样热烈地讨论起人工智能。令人高兴的是,这也推动了2017年《新一代人工智能发展规划》的出台。”吴飞说。

人工智能与推动人类进入工业革命时代的蒸汽机一样,也是一项通用使能技术。美国历史学家斯塔夫里阿诺斯在《全球通史》一书中曾赞誉“蒸汽机的历史意义无论怎样夸大都不为过”,而人工智能对于人类未来的意义也是如此。

让世界看到人工智能的巨大潜力,让更多人投身于技术创新与突破,让人工智能这一通用战略性技术如水和电一样进入我们的生活,这或许正是一个现象级产品的意义所在。

最后,让我们跟随ChatGPT创作的一首小诗,一窥人工智能的广阔未来。“拥有语言技巧,理解人类的心灵,我的目标是,让每个人的生活更美好……”

THE END
1.最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂本文解释得非常全面,还通俗易懂 目录 01 ChatGPT是什么? 02 ChatGPT能做什么? 1)回答问题。 2)撰写文章。 3)总结提炼。 4)生成代码。 03 ChatGPT 的缺点和问题 04 ChatGPT的未来前景 1)搜索。 2)阅读。 3)写作。 05 微调:训练你自己的人工智能https://blog.csdn.net/sunyctf/article/details/129129579
2.chatgpt说它有上千亿的参数,是什么意思?简介:chatgpt说它有上千亿的参数,是什么意思? 最近在捣鼓深度学习,今天突然开窍,对于大模型、上千亿参数的理解顿悟了,所以才有了这篇文章。 一个通俗易懂的模型举例 先用一个最简单的例子来说明,例如身高和体重之间是有一定对应的关系的。 如果我们有了非常多身高与体重对应关系的数据,我们就可以运用这些数据得到https://developer.aliyun.com/article/1228733
3.chatgpt什么意思ChatGPT是一个基于人工智能技术的聊天机器人。 ChatGPT的基本概念 ChatGPT,全称为'Chat Generative Pre-training Transformer',中文意思是“聊天生成预训练转换器”,是一种基于人工智能技术的聊天机器人。它代表了当前最先进的自然语言处理(NLP)技术,通过深度学习和大规模预训练,ChatGPhttps://localsite.baidu.com/site/wjzsorv8/8cd47d9a-7797-42f3-9306-b902ded71161?qaId=1270687&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&efs=1&ch=54&srcid=10014&source=natural&category=%E5%B0%8F%E5%AD%A6%E8%8B%B1%E8%AF%AD&eduFrom=136&botSourceType=46
4.chatgpt是什么意思?chatgpt是啥软件?chatgpt有什么用?chatgpt是什么意思?chatgpt是啥软件?chatgpt是人工智能研究实验室OpenAI研发的聊天机器人程序,你可以把它当做一个人工智能聊天软件,那么下面炫酷小编为大家分享chatgpt有什么用。 chatgpt怎么下载? chatGPT手机中文版下载:http://gaokaoxz.715083.com:8020/chatgpt_980.apk https://m.oyooyo.cn/news/27803.html
5.chatgpt是什么?使用ChatGPT可以做的11件事电脑知识ChatGPT 可能有助于以通俗易懂的方式解释它们。我们提示 ChatGPT “像我 5 岁时一样解释虫洞”,结果如下。 我们还提示它以类似的方式解释互联网。这也不算太糟糕。 4. 逐步解决棘手的数学问题 无论您是要解决复杂的代数问题还是难以拼凑的简单数学问题,ChatGPT 在处理数学方面都特别强大。为了获得最佳结果,您需http://www.dnpz.net/diannaozhishi/6115.html
6.最近很火的ChatGPT究竟是什么?会给我们的生活带来什么改变?而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。 ChatGPT 能做什么? 了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么? https://36kr.com/p/2124639705736454
7.麻烦详细说明下,CHATGPT概念股是什么意思?你好,chatgpt概念股其实就是人工智能相关的股票。chatgpt是OpenAI开发的一个大型预训练语言模型,通俗一点https://licai.cofool.com/ask/qa_2057808.html
8.人人都懂的ChatGPT指南:原理价值应用理解原理是有效应用的第一步。ChatGPT是基于GPT模型的AI聊天产品,后文均简称为GPT。 从技术上看,GPT是一种基于Transformer架构的大语言模型(LLM)。GPT这个名字,实际上是'Generative Pre-trained Transformer'的缩写,中文意为“生成式预训练变换器”。 1.大模型和传统AI的区别是什么? http://www.360doc.com/content/23/0730/08/37102638_1090546201.shtml
9.科普ChatGPT及其影响说实话,想通俗的讲出来这个东西还有点难哈哈。今天先到这里,楼主也准备睡了。大致的总结一下上面的内容: 1、chatgpt是openai开发的一个语言模型,他的能力就是对语言进行理解,他对所有问题的解答也是基于对之前学习过的语言的综合考虑。(当然新发布的GPT-4还能读图片了,更牛了)。 2、这个东西怎么来的呢,大力飞https://m.douban.com/group/topic/285857238
10.如何用chatgpt学习炒股现在我们了解了Chat GPT是什么?为什么叫Chat GPT?GPT的各个版本、如何用Chat GPT!以后我们有问题就可以http://chatgpt.cmpy.cn/ask/1201005.html
11.看似无所不能,ChatGPT会不会成为行业“终结者”为什么这么说?我们可以尝试同时问ChatGPT和苹果智能手机助手Siri一个前阵子所有人都特别关心的问题:“阳”了之后该注意什么? 这时,Siri会因为无法理解问题,直接为我们到网上搜索已有的答案,但是ChatGPT却像一个真正的健康专家一样,合成出了像模像样的回答,而这一解答并非是网络上已经存在的。 https://www.zjds.org.cn/jzjd/40541.jhtml