ChatGPT三篇文章摘录研究成果广西壮族自治区信息中心

编者按:ChatGPT是由OpenAI公司推出的一款人工智能聊天机器人程序,能实现撰写邮件、视频脚本、文案、翻译、代码,写论文等任务,被认为正在“掀起新一轮AI革命”。ChatGPT上线不到一周日活用户破百万,2个月破亿,迅速火爆全网,成为史上用户增长速度最快的消费级应用。ChatGPT的推出将不断拓展海量应用场景,赋能传统领域智能化发展,推动AI行业开启新发展浪潮。

本期要目

ChatGPT的概念特征及发展现状

ChatGPT的技术发展路径

ChatGPT的未来应用场景

一、ChatGPT的概念特征

ChatGPT是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具。它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码等任务。

表1ChatGPT特点

ChatGPT是在GPT3.5大模型语言模型(LLM,即LargeLanguageModel)的基础上,加入“基于人类反馈的强化学习(RLHF,ReinforcementLearningfromHumanFeedback)”来不断微调(Fine-tune)预训练语言模型,使得LLM模型学会理解不同类型的命令指令,并通过多重标准合理判断基于给定的prompt输入指令,输出的是否为优质信息(这些标准包括:富含信息、内容丰富、对用户有帮助、无害、不包含歧视信息等)。

二、ChatGPT的优势与独特性

目前,ChatGPT不需要任何额外的训练就能在多种不同的领域中应用并快速输出高质量的文本,相较于以前的模型已具备较强的自然语言处理能力,具体来讲可归纳为以下几点:

第一、更强的对话能力:ChatGPT支持多轮对话,在自然语言交互方面、情感分析、情景会话等方面运行流畅,在语言模仿能力和逻辑判断方面展现出更强的能力。

第二、更全面的语言能力:ChatGPT支持多种语言环境,并且支持长短句输入,在阅读理解、复杂语句处理、逻辑能力和文本生成方面更加灵活。

第三、更高精度的预测结果:ChatGPT的训练模型支持大规模数据集,具备海量的话题库,通用性更强。

三、ChatGPT现存的缺陷和发展瓶颈

(一)精准性、真实性、重复率和依赖性尚待改善

第二、在较长的会话中,由于训练数据的偏差和过度修正,ChatGPT会过度强调某些短语或者句子,导致重复性高的问题。例如它会重申它是由OpenAI训练的语言模型,这可能源于训练者对模型回答全面性的优化。而且,ChatGPT对多次调整输入措辞或尝试相同的输入指令也会很敏感。例如,给定一个问题,模型可以声称不知道答案或拒绝回答,但在指令稍作调整后,ChatGPT也会识别并回答。

第三、ChatGPT的强大能力依赖语料库、数据量的抓取和复杂的训练过程,训练成本和所需算力的成本都很高。如果数据库的收录内容质量不高或者数据量不够大,将会影响生成文本内容的质量和精细度,而且ChatGPT模型训练和优化过程较为复杂,需要专业的人员进行操作,训练成本和所需算力的成本都很高。最重要的是,ChatGPT模型依赖于大规模离线语料进行训练,往往不能充分接受并采用在线提供的即时信息,难以理解对话中提及的因果关系,也无法基于已有信息进行推测,这距离人类举一反三的能力相差较远。

(二)发展瓶颈:人工智能的安全性和伦理约束

表2GPT三代的对比

一、GPT初代:无监督的预训练结合有监督的模型微调

2018年,在自然语言处理领域(NLP)刚兴起时,OpenAI就推出的初代GPT,它的运行逻辑是:先通过无标签数据学习生成语言模型,并能够运用于一些与有监督任务无关的NLP任务中。此后再根据特定的下游任务进行有监督的微调,提高其泛化能力。常用的有监督任务主要有:

自然语言推理:判断两个句子的关系,是包含关系、矛盾关系或者中立关系;

分类:判断输入文本的指定类别。

在经过有监督的微调后,GPT-1的泛化能力会得到明显提升,且随着训练次数的增加,GPT-1的性能逐步提升。但是初代GPT仅仅使用了解码器部分,其transformer结构中对于词向量的学习能力得到发挥,能够实现较好地语言理解,适用于文本生成领域,但在通用语言和会话交流方面,还有较大的欠缺。

二、GPT-2:扩展了网络参数和数据集,进行多任务学习

相较于初代GPT,2019年推出的GPT-2整体上结构和设计没有变化,但学习目标是使用无监督的预训练模型作为有监督学习的任务,其核心逻辑在于让所有监督学习成为无监督语言模型的子集。换言之,GPT-2可以在数据量足够丰富且模型容量足够大时,通过训练语言模型就能够完成有监督学习的任务。实际训练中,GPT-2和GPT初代不同点在于:

(二)更庞大的网络参数:将transformer的层数增加到48,隐层(hiddenlayer)维度扩展到1600,实现了15亿的参数量;

(三)不再针对不同的任务建模微调:将机器翻译、自然语言推理、语义分析、关系提取等10类任务统一建模为一个分类任务,让模型在预训练中自己识别任务。

在性能方面,GPT-2可以在多个特定的语言场景下良好地完成NLP任务,除了语言理解能力外,还可以胜任翻译生成、故事编写、总结摘要等。这些能力基于海量数据和大量参数训练的词向量模型,不需要监督微调和额外的训练即可迁移,基本实现了元学习。同时,GPT-2能够让数据库中词向量包含的信息在多任务中通用,实现了信息脱离具体的NLP任务存在,也证明了随着模型容器和数据量扩充,GPT的无监督学习具有很大的提升空间。

三、GPT-3:海量参数,成就最强大的语言模型

四、InstructGPT和ChatGPT:更好地遵循用户意图、更少的虚假信息

相较于GPT-3,OpenAI在2022年初发布了InstructGPT。该语言模型在GPT-3的基础上进行微调,并在工作原理上增加了对齐研究,强化InstructGPT模型的语义理解;同时,通过“基于人类反馈的强化学习(RLHF)和监督学习”来提高输出质量。具体地,开发人员可以将训练划分为三个阶段:

第一阶段:冷启动阶段的策略模型。随机抽取用户提交的指令或问题,即prompt,并进行专业的人工标注,用这些指定的prompt和高质量答案共同微调GPT-3.5模型,使之初步具备理解输入指令或问题的能力。

第二阶段:训练回报模型。在第一阶段生成的众多结果中,根据结果质量由人工标注排序并作为训练数据,通过监督学习中的匹配排序训练回报模型对语言模型预训练的输出结果评分,回答质量越高,分数越高。

第三阶段:采用强化学习来增强预训练模型的能力。利用第二阶段学好的RM模型更新预训练模型的参数,不断从prompt库中抽取新命令,通过PPO(ProximalPolicyOptimization)算法生成回答后,循环执行第一到三阶段进行强化训练,最终鼓励LLM模型能够输出更高质量的回答。

虽然InstructGPT的参数量仅为13亿左右,相比于GPT-3缩小了100倍以上;但在遵循指令方面,能够更好地遵循用户意图,将有害的、不真实或者有偏差的信息输出最小化。在优化的模型上,ChatGPT基于InstructGPT进一步改进,在模型结构和训练流程上遵循上述方式,但收集和标注数据的方式上发生了变化。

InstructGPT模型需要先完成类似的输入、输出匹配,取得多个匹配结果后再跟模型的预训练数据对比,在第二阶段的RM中只有奖励、没有惩罚机制;而ChatGPT则是在输入prompt,模型输出多个answer后,直接对输出结果进行人为排序,根据排序后的结果让模型完成预训练中从最优到最劣的排序。通过采取监督学习的方式让模型学习人类排序的方式。

THE END
1.ChatGPT是什么ChatGPT是聊天机器人吗ChatGPT是是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,不仅上知天文下知地理,知识渊博,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,但ChatGPT不单是聊天机器人的简单,甚至能完成撰写邮件、视频https://g.pconline.com.cn/x/157/15726425.html
2.麻烦详细说明下,CHATGPT概念股是什么意思?你好,chatgpt概念股其实就是人工智能相关的股票。chatgpt是OpenAI开发的一个大型预训练语言模型,通俗一点https://licai.cofool.com/ask/qa_2057808.html
3.小伙伴问答专区提问:什么是ChatGPT概念?来自Stock环球之旅小伙伴问答专区提问:什么是ChatGPT概念?一脸懵逼哦答:ChatGPT是由美国公司OpenAI开发的一个人工智能聊天机器人程序,于2022年11月推出,ChatGPT在很多方面的能力超出了许多业内研究人员预期,包括可以完成自动文本生成、自动问答等多种复杂任务,被不少业内人士视为未来人工智能生产内容(AIGC)产业发展的重要推动力。如果https://weibo.com/6633611311/MrMaYEEGP
4.ChatGPT是什么?全面为你讲解ChatGPT!ChatGPT是什么?全面为你讲解ChatGPT! 随着人工智能技术的不断发展,ChatGPT作为一款新型的自然语言处理(NLP)技术应运而生,引起了广泛的关注。ChatGPT是一款由OpenAI开发的大型语言模型,它能够理解和生成人类语言,并且可以在各种应用场景中发挥重要作用。本文将详细介绍ChatGPT的基本概念、原理和优势,以及它在实际应用中https://www.yutu.cn/news_51983.html
5.最近火爆全网的ChatGPT到底是什么?ChatGPT最近火爆全网,一周的时间,用户过百万;只用了两个月的时间,用户过亿,这是个什么概念,抖音的海外版Tiktok用了十个月的时间才做到的用户过亿,而ChatGPT只用了两个月的时间就做到了。 马斯克跟这家公司有着千丝万缕的关系。比尔盖茨是这家公司的投资人,比尔盖茨说:ChatGPT的出现堪比个人电脑和互联网技术的发https://www.jianshu.com/p/5cea26900c09
6.2023年爆火的软件“ChatGPT”到底是个什么呢?ChatGPT的详解以及概念 ChatGPT,美国OpenAI研发的聊天机器人程序,于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码,写论文等任务。 http://www.quwaifu.com/News/View/22739
7.ChatGPT热度飙升人工智能再临风口投资机会怎么看?兔年开年以来,ChatGPT概念热度飙升,推动AIGC和人工智能板块大涨,站上了A股的风口浪尖。 有朋友跟挖掘基吐槽:前段时间爆火的AIGC还没弄明白,ChatGPT又横空出世了,不愧是大A,不管有没有赚上钱,但基民、股民总能紧跟科技前沿,再收获满腹知识~ 言归正传,大热的AIGC和ChatGPT概念具体是什么意思?是短期炒作还是长期机https://wap.eastmoney.com/a/202302082630467128.html
8.什么是ChatGPT合租服务?如何选择合适自己的ChatGPT服务!哪些职业适合使用ChatGPT: 内容创作者和写作者 博客作者、小说家、自由撰稿人:可以使用ChatGPT生成文章初稿、思路拓展或编辑校对。 营销人员:用于创造营销文案、广告语、社交媒体帖子。 编程和技术领域 软件开发人员:获取编码帮助、调试代码或理解新技术概念。 https://sspai.com/post/87736
9.最近很火的ChatGPT究竟是什么?本文解释得非常全面,还通俗易懂02 ChatGPT能做什么? 了解完ChatGPT的原理,我们自然会关心一个问题:就目前而言,ChatGPT究竟能做什么? 1)回答问题。 这可能是ChatGPT最简单的应用。你在聊天界面里向它提问,比如「波粒二象性是什么意思」,它就会用流畅的语言向你解释,把这个概念讲解得非常清楚。就我试用的体验而言,效果非常好,简洁晓畅,表达能力https://blog.csdn.net/sunyctf/article/details/129129579
10.ChatGPT里的GPT,分别代表什么?一个数据人的自留地后面也会有更多的非常厉害的应用,会基于ChatGPT走出来。 3、 Transformer中有一个很重要的概念,注意力机制。 什么是注意力机制呢? 就是从你输入的信息中,挑出重要的信息,把注意力集中在这些重要的信息上,忽略不重要的信息。这样就能更好的理解你说的话。 https://www.shangyexinzhi.com/article/7187722.html