ChatGPT中,GPT分别是什么意思?赵青青

流行的技术名词按发音难度排序,ChatGPT肯定排在前面。

到底它为什么叫做ChatGPT呢?

先说GPT:GenerativePre-TrainingTransformer

虽然我们已经习惯了话唠的机器人絮絮叨叨的说个不停,但这只是众多的人工智能模型的一种方式。比如还有识别类的(Congnition):人脸识别,车牌识别这些,还有语音识别,文字识别各种识别任务。(在提到模型的时候,也常常被叫做判别模型,discriminative)。Generative这个大的种类里面有几个小分支,DALLE的画图的用的是对抗网络方式GAN(这个晚些可以分析),现在最火的StableDiffusion,MidJourney走向了另外一个分支,叫做Difusion,而ChatGPT又是一个分支,就是转换器Transformer。

而TransformerGenerative的语言模型的核心,通俗的说就是「顺口溜」。

当看了足够多的文本以后,发现有一些语言模式是反复出现的。它之所以可以准确的填补「锄禾日当__」的空格,不是因为它在自己的大脑子里面重构了一副农民劳动的场景,仅仅是不过脑子,顺口溜出来的。

你问它:3457*43216=,它回答149575912(这是错的。正确结果是149397712)。之所以结果的2是对的,仅仅因为它读了太多的文字资料以后,隐约感觉到

7结尾的文字,乘号,6结尾的文字,和2结尾的文字比较「押韵」

从语感上比较像一首诗,所以它就学会了这样的文字,而不是学会了计算。

生成式模型努力解决的问题,就是给定一些字,预测如果是人类会写什么字。

在BERT那个年代,为了训练,大家常常把一句话中随机几个单词遮起来,让计算机用现有的模型预测那几个单词,如果预测准了,就继续加强,如果预测错了,就调整模型,直到上百万上亿次训练之后越来越准。只不过ChatGPT的Generative的部分,不仅仅把文字,还把上下文、intention(意图)也放进去做训练和预测。

以前很多的人工智能模型都是为了一个目标训练的。比如给我1000张猫的照片,我就很容易的可以训练出来一个模型,判断一个图片是有猫还是没有猫。这些都是专用的模型。

而Pre-Training模型不是为了特定的目标训练,而是预先训练一个通用的模型。如果我有特定的需求,我可以在这个基础上进行第二次训练,基于原来已经预训练的模型,进行微调(Fine-Tuning)。

这事儿就像家里请了个阿姨,她已经被劳务公司预训练了整理家务的知识,在此之前已经被小学老师预训练了中文对话,到了我家里面我只要稍微finetune一些我家里特定的要求就好了,而不需要给我一个「空白」的人,让我从教汉语开始把她彻底教一遍才能让她干活。

ChatGPT的预训练就是给了我们所有人(尤其是创业者,程序员)一个预先训练好的模型。这个模型里面语言是强项,它提供的内容无论多么的胡说八道,至少我们必须承认它的行文通畅程度无可挑剔。这就是他pre-training的部分,而回答的内容部分,正是我们需要finetuning的。我们不能买了个Apache服务器回来,不灌内容,就说他输出的内容不够呀。

变电器就是一种transformer:220伏电进,12伏出。

语言的转换器就是把语言的序列作为输入,然后用一个叫做编码器encoder的东西变成数字的表现(比如GPT就用1536个浮点数(也叫1536维向量)表示任何的单词,或者句子,段落,篇章等),然后经过转化,变成一串新的序列,最后再用decoder把它输出。这个转换器,是这个自然语言处理的核心。

比如如果给ChatGPT输入「Apple」这个词,它给你返回

[0.0077999732,-0.02301609,-0.007416143,-0.027813964,-0.0045648348,0.012954261,.....0.021905724,-0.012022103,-0.013550568,-0.01565478,0.006107009]

这1536个浮点数字来表示Apple(其中一个或着多个维度的组合表达了「甜」的含义,另外一堆表达了「圆」的含义,还有一大堆共同表达了「红」等等属性组合,至于具体哪些表达了这些,不得而知)

然后这堆数字,再交给decoder,并且限定中文的话,它会解码成为「苹果」,限定西班牙语的话,它会解码成「manzana」,限定为emoji的话,就输出「」。总之,通过编码,转换,解码,它就完成了从Apple到目标输出语言的转化。

ChatGPT所做的事情远远多于翻译。但核心上,它就是把一个语言序列,转换为了另外一堆语言序列,这个任务完成得如此的好,以至于让人产生了它有思想的错觉。

把上面三段话加在一起,GPT就是

一个预先训练好的,用生成的方式,把输入文字转化成输出文字的翻译

除了这个以外的各种能力和各种定义,大多数是这个翻译官的应用场景而不是它本身。

刚才解释了GPT,那ChatGPT呢?

OpenAI用这个名字描述他们正在做的这个模型,历史的版本包括GPT-1,GPT-2(这个模型是开源的),GPT-3(这个就是传说中175B参数的大模型)。而这些都是生成式的,也就是给的prompt(提示词),它负责补全(completion)。但是这个东西用于聊天不是很好用,因为本来就不是为聊天这个场景准备的。

所以在GPT-3基础上发展出了下一代模型InstructGPT,专注于让这个模型可以听懂指令。在上面继续发展出了ChatGPT,就是对于对话场景,比如多轮对话,还有一些安全边界设定等,进行了加强。但这个模型是基于GPT-3上面的,可以说严格意义是GPT-3模型上面的一个微调(FineTuning)的产物。

欢迎转发给对ChatGPT感兴趣的朋友。欢迎专业人士指正(我其实不懂自然语言处理里面的细节)

THE END
1.最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂本文解释得非常全面,还通俗易懂 目录 01 ChatGPT是什么? 02 ChatGPT能做什么? 1)回答问题。 2)撰写文章。 3)总结提炼。 4)生成代码。 03 ChatGPT 的缺点和问题 04 ChatGPT的未来前景 1)搜索。 2)阅读。 3)写作。 05 微调:训练你自己的人工智能https://blog.csdn.net/sunyctf/article/details/129129579
2.chatgpt说它有上千亿的参数,是什么意思?简介:chatgpt说它有上千亿的参数,是什么意思? 最近在捣鼓深度学习,今天突然开窍,对于大模型、上千亿参数的理解顿悟了,所以才有了这篇文章。 一个通俗易懂的模型举例 先用一个最简单的例子来说明,例如身高和体重之间是有一定对应的关系的。 如果我们有了非常多身高与体重对应关系的数据,我们就可以运用这些数据得到https://developer.aliyun.com/article/1228733
3.chatgpt什么意思ChatGPT是一个基于人工智能技术的聊天机器人。 ChatGPT的基本概念 ChatGPT,全称为'Chat Generative Pre-training Transformer',中文意思是“聊天生成预训练转换器”,是一种基于人工智能技术的聊天机器人。它代表了当前最先进的自然语言处理(NLP)技术,通过深度学习和大规模预训练,ChatGPhttps://localsite.baidu.com/site/wjzsorv8/8cd47d9a-7797-42f3-9306-b902ded71161?qaId=1270687&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&efs=1&ch=54&srcid=10014&source=natural&category=%E5%B0%8F%E5%AD%A6%E8%8B%B1%E8%AF%AD&eduFrom=136&botSourceType=46
4.chatgpt是什么意思?chatgpt是啥软件?chatgpt有什么用?chatgpt是什么意思?chatgpt是啥软件?chatgpt是人工智能研究实验室OpenAI研发的聊天机器人程序,你可以把它当做一个人工智能聊天软件,那么下面炫酷小编为大家分享chatgpt有什么用。 chatgpt怎么下载? chatGPT手机中文版下载:http://gaokaoxz.715083.com:8020/chatgpt_980.apk https://m.oyooyo.cn/news/27803.html
5.chatgpt是什么?使用ChatGPT可以做的11件事电脑知识ChatGPT 可能有助于以通俗易懂的方式解释它们。我们提示 ChatGPT “像我 5 岁时一样解释虫洞”,结果如下。 我们还提示它以类似的方式解释互联网。这也不算太糟糕。 4. 逐步解决棘手的数学问题 无论您是要解决复杂的代数问题还是难以拼凑的简单数学问题,ChatGPT 在处理数学方面都特别强大。为了获得最佳结果,您需http://www.dnpz.net/diannaozhishi/6115.html
6.最近很火的ChatGPT究竟是什么?会给我们的生活带来什么改变?而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。 ChatGPT 能做什么? 了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么? https://36kr.com/p/2124639705736454
7.麻烦详细说明下,CHATGPT概念股是什么意思?你好,chatgpt概念股其实就是人工智能相关的股票。chatgpt是OpenAI开发的一个大型预训练语言模型,通俗一点https://licai.cofool.com/ask/qa_2057808.html
8.人人都懂的ChatGPT指南:原理价值应用理解原理是有效应用的第一步。ChatGPT是基于GPT模型的AI聊天产品,后文均简称为GPT。 从技术上看,GPT是一种基于Transformer架构的大语言模型(LLM)。GPT这个名字,实际上是'Generative Pre-trained Transformer'的缩写,中文意为“生成式预训练变换器”。 1.大模型和传统AI的区别是什么? http://www.360doc.com/content/23/0730/08/37102638_1090546201.shtml
9.科普ChatGPT及其影响说实话,想通俗的讲出来这个东西还有点难哈哈。今天先到这里,楼主也准备睡了。大致的总结一下上面的内容: 1、chatgpt是openai开发的一个语言模型,他的能力就是对语言进行理解,他对所有问题的解答也是基于对之前学习过的语言的综合考虑。(当然新发布的GPT-4还能读图片了,更牛了)。 2、这个东西怎么来的呢,大力飞https://m.douban.com/group/topic/285857238
10.如何用chatgpt学习炒股现在我们了解了Chat GPT是什么?为什么叫Chat GPT?GPT的各个版本、如何用Chat GPT!以后我们有问题就可以http://chatgpt.cmpy.cn/ask/1201005.html
11.看似无所不能,ChatGPT会不会成为行业“终结者”为什么这么说?我们可以尝试同时问ChatGPT和苹果智能手机助手Siri一个前阵子所有人都特别关心的问题:“阳”了之后该注意什么? 这时,Siri会因为无法理解问题,直接为我们到网上搜索已有的答案,但是ChatGPT却像一个真正的健康专家一样,合成出了像模像样的回答,而这一解答并非是网络上已经存在的。 https://www.zjds.org.cn/jzjd/40541.jhtml