通俗易懂chatGPT原理

有监督微调(SupervisedFine-tuning,SFT)

其他方法

思维链(Chain-of-thought,CoT)

与chatGPT类似的工作

引用

收集NLP各种任务的数据集,加上任务描述和提示组装成新的数据集,并使用这些数据微调预训练的大型语言模型。包括指令微调和有监督微调。

从上述数据集中采样,使用大型语言模型生成多个响应,手动对这些响应进行排名,并训练奖励模型(RM)以适应人类偏好。

img

GPT-3.5参数量仍然为175B,总体进化树如下:

GPT-3是一种自回归模型,仅使用解码器,训练目标也是预测下一个单词(没有判断下一句任务)。

最大的GPT-3模型有175B参数,是BERT模型大470倍(0.375B)

image-20230221144754842

不需要微调

一个模型解决NLP多种任务

NLP任务都可以用生成模型解决

和人类一样,只需要看极少数量的样例就能学会

零样本学习:提供任务描述、提示

单样本学习:提供任务描述、一个样例、提示

少样本学习:提供任务描述、几个样例、提示

BERT-large:BooksCorpus800Mwords、EnglishWikipedia2.5Bwords

GPT-2:WebText2,BooksCorpus、Wikipedia总量达到了40GB。

GPT-3:**WebText2,BooksCorpus、Wikipedia、CommonCrawl**等数据集45TB数据。

image-20230221153905277

指令微调(InstructionFine-Tuning,IFT)

收集NLP各种任务的数据集,加上任务描述和提示组装成新的数据集。chatGPT使用到的数据集如下:

image-20230221113507381

UnnaturalInstructions(Honovich等,'22)//arxiv.org/abs/2212.09689

Super-naturalinstructions(Wang等,'22)//arxiv.org/abs/2204.07705

Self-Instruct(Wang等,'22)//arxiv.org/abs/2212.10560

T0(Sanh等,'22)//arxiv.org/abs/2110.08207

Naturalinstructions数据集(Mishra等,'22)//arxiv.org/abs/2104.08773

FLANLM(Wei等,'22)//arxiv.org/abs/2109.01652

OPT-IML(Iyer等,'22)//arxiv.org/abs/2212.12017

人类反馈强化学习(ReinforcementLearningFromHumanFeedback,RLHF)

描述:

策略(policy):一个接受提示并返回一系列文本(或文本的概率分布)的LM。

行动空间(actionspace):LM的词表对应的所有词元(一般在50k数量级),

观察空间(observationspace)是可能的输入词元序列,也比较大(词汇量^输入标记的数量)。

奖励函数是偏好模型和策略转变约束(Policyshiftconstraint)的结合。

此过程分为两步:

用强化学习(RL)方式微调LM

开源数据集:

OpenAI使用的是用户提交的反馈。

image-20230221111329526

这部分简单介绍一下和chatGPT使用的微调并列的一些方法

如下图所示使用一些带有逐步推理的数据集进行微调

橙色是任务描述,粉色是问题和答案,蓝色是推理过程

思维链提示(Wei等,'22)//arxiv.org/abs/2201.11903

Meta的BlenderBot//arxiv.org/abs/2208.03188

Google的LaMDA//arxiv.org/abs/2201.08239

DeepMind的Sparrow//arxiv.org/abs/2209.14375

Anthropic的Assistant//arxiv.org/abs/2204.05862

审核编辑:李倩

原文标题:通俗易懂chatGPT原理

长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)

THE END
1.最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂本文解释得非常全面,还通俗易懂 目录 01 ChatGPT是什么? 02 ChatGPT能做什么? 1)回答问题。 2)撰写文章。 3)总结提炼。 4)生成代码。 03 ChatGPT 的缺点和问题 04 ChatGPT的未来前景 1)搜索。 2)阅读。 3)写作。 05 微调:训练你自己的人工智能https://blog.csdn.net/sunyctf/article/details/129129579
2.chatgpt说它有上千亿的参数,是什么意思?简介:chatgpt说它有上千亿的参数,是什么意思? 最近在捣鼓深度学习,今天突然开窍,对于大模型、上千亿参数的理解顿悟了,所以才有了这篇文章。 一个通俗易懂的模型举例 先用一个最简单的例子来说明,例如身高和体重之间是有一定对应的关系的。 如果我们有了非常多身高与体重对应关系的数据,我们就可以运用这些数据得到https://developer.aliyun.com/article/1228733
3.chatgpt什么意思ChatGPT是一个基于人工智能技术的聊天机器人。 ChatGPT的基本概念 ChatGPT,全称为'Chat Generative Pre-training Transformer',中文意思是“聊天生成预训练转换器”,是一种基于人工智能技术的聊天机器人。它代表了当前最先进的自然语言处理(NLP)技术,通过深度学习和大规模预训练,ChatGPhttps://localsite.baidu.com/site/wjzsorv8/8cd47d9a-7797-42f3-9306-b902ded71161?qaId=1270687&categoryLv1=%E6%95%99%E8%82%B2%E5%9F%B9%E8%AE%AD&efs=1&ch=54&srcid=10014&source=natural&category=%E5%B0%8F%E5%AD%A6%E8%8B%B1%E8%AF%AD&eduFrom=136&botSourceType=46
4.chatgpt是什么意思?chatgpt是啥软件?chatgpt有什么用?chatgpt是什么意思?chatgpt是啥软件?chatgpt是人工智能研究实验室OpenAI研发的聊天机器人程序,你可以把它当做一个人工智能聊天软件,那么下面炫酷小编为大家分享chatgpt有什么用。 chatgpt怎么下载? chatGPT手机中文版下载:http://gaokaoxz.715083.com:8020/chatgpt_980.apk https://m.oyooyo.cn/news/27803.html
5.chatgpt是什么?使用ChatGPT可以做的11件事电脑知识ChatGPT 可能有助于以通俗易懂的方式解释它们。我们提示 ChatGPT “像我 5 岁时一样解释虫洞”,结果如下。 我们还提示它以类似的方式解释互联网。这也不算太糟糕。 4. 逐步解决棘手的数学问题 无论您是要解决复杂的代数问题还是难以拼凑的简单数学问题,ChatGPT 在处理数学方面都特别强大。为了获得最佳结果,您需http://www.dnpz.net/diannaozhishi/6115.html
6.最近很火的ChatGPT究竟是什么?会给我们的生活带来什么改变?而对这个 GPT-3.5 进行包装、优化所形成的 ChatGPT,就是一个交互层,它的本质就是加了一层更友好的用户界面和交互方式,让个人用户能够更容易地应用它。 ChatGPT 能做什么? 了解完 ChatGPT 的原理,我们自然会关心一个问题:就目前而言,ChatGPT 究竟能做什么? https://36kr.com/p/2124639705736454
7.麻烦详细说明下,CHATGPT概念股是什么意思?你好,chatgpt概念股其实就是人工智能相关的股票。chatgpt是OpenAI开发的一个大型预训练语言模型,通俗一点https://licai.cofool.com/ask/qa_2057808.html
8.人人都懂的ChatGPT指南:原理价值应用理解原理是有效应用的第一步。ChatGPT是基于GPT模型的AI聊天产品,后文均简称为GPT。 从技术上看,GPT是一种基于Transformer架构的大语言模型(LLM)。GPT这个名字,实际上是'Generative Pre-trained Transformer'的缩写,中文意为“生成式预训练变换器”。 1.大模型和传统AI的区别是什么? http://www.360doc.com/content/23/0730/08/37102638_1090546201.shtml
9.科普ChatGPT及其影响说实话,想通俗的讲出来这个东西还有点难哈哈。今天先到这里,楼主也准备睡了。大致的总结一下上面的内容: 1、chatgpt是openai开发的一个语言模型,他的能力就是对语言进行理解,他对所有问题的解答也是基于对之前学习过的语言的综合考虑。(当然新发布的GPT-4还能读图片了,更牛了)。 2、这个东西怎么来的呢,大力飞https://m.douban.com/group/topic/285857238
10.如何用chatgpt学习炒股现在我们了解了Chat GPT是什么?为什么叫Chat GPT?GPT的各个版本、如何用Chat GPT!以后我们有问题就可以http://chatgpt.cmpy.cn/ask/1201005.html
11.看似无所不能,ChatGPT会不会成为行业“终结者”为什么这么说?我们可以尝试同时问ChatGPT和苹果智能手机助手Siri一个前阵子所有人都特别关心的问题:“阳”了之后该注意什么? 这时,Siri会因为无法理解问题,直接为我们到网上搜索已有的答案,但是ChatGPT却像一个真正的健康专家一样,合成出了像模像样的回答,而这一解答并非是网络上已经存在的。 https://www.zjds.org.cn/jzjd/40541.jhtml