智库观点|ChatGPT对文献情报工作的影响

ChatGPT是什么,可以从以下五个方面来把握。

(1)ChatGPT的对外表现是一个聊天机器人。它能够通过学习和理解人类语言来与人进行对话,具有依据对话的上下文环境来回答问题的能力,就像人一样来与人类进行聊天交流。

(3)ChatGPT的关键基础是生成式大规模语言模型。即基于生成式预训练的变换器(GenerativePre-trainedTransformer,GPT),它以生成式的自监督学习为基础,从TB级训练数据中学习隐含的语言规律和模式,训练出的千亿级别参数量的大规模语言模型。

(4)ChatGPT的核心技术是InstructGPT。它采用了基于人类反馈的强化学习(ReinforcementLearningwithHumanFeedback,RLHF),让人工智能模型的产出和人类的常识、认知、需求、价值观保持一致。

(5)ChatGPT的主要特点是与前期类似产品相比,编造事实大幅下降,生成的毒内容更少。它在一定程度上解决了传统语言模型在复杂多领域的知识利用、演绎推理、欺骗性反应等方面的缺陷,使回答更具有用性和真实性,具有编造事实大幅下降,生成的模仿性谎言(imitativefalsehoods)、毒内容(toxicoutput)更少的重要特征。

ChatGPT的核心技术体系如图1所示。

图1ChatGPT的核心技术体系

2、人工智能技术迅速发展给文献情报工作的启示

总结近十余年来人工智能的主要发展历程,我们认为人工智能取得突飞猛进的根本原因在于计算机学习知识、开发利用知识的模式已经改变。能够从各类数据资源(语料)中快速高效地学习到隐藏于这些数据资源中的知识是AI飞速突破的本质所在。

以ChatGPT为代表的AI技术的迅速发展源于知识学习能力的大幅提升。它带给文献情报机构提升知识学习有以下启示:

(2)深度学习的性能提升,除模型突破之外,更要归功于语料和算力。各类深度学习模型是基础,大量可计算数据资源(训练语料)是前提,大规模计算能力是催化剂。拥有大样本训练语料和大规模计算能力,使得基于人工神经网络深度学习的知识学习性能大幅提升。

(3)自然语言处理的技术已经重写,无监督的预训练对于知识学习有重要价值。基于预训练(Pre-Training)和微调(Fine-Tuning)的两阶段学习方法,改写了自然语言处理(NLP)方式,无监督的预训练具有重要价值。利用大规模非标注语料的无监督的预训练,能够使模型从语料中学习到语言表达模式、文字前后逻辑、知识元间关系等知识内容,提高了模型的泛化能力和鲁棒性。在此基础上只用少量标注语料进行微调,即可在特定下游任务中取得较好的效果。

(4)ChatGPT并不是无来由的横空出世,而是学习能力从量变到质变的重大突破。回顾历史来看,从最初的1.17亿参数、5GB语料、12层Transformer的GPT-1模型,到目前的1750亿参数、45TB语料、96层Transformer、采用人类反馈强化学习的ChatGPT模型。ChatGPT是语料、模型、算法,通过迭代训练不断积累而成的。人工智能知识学习能力上,每一个小小的进步都是有价值的,久久为功,不断进步,最终实现了从量变到质变的转换。

(5)ChatGPT是集成创新的成果,学习能力的提升得益于软件、硬件、技术、语料的有效集成。为了适应模型参数量的激增,OpenAI收集、标注了更多的原始训练语料;为了实现更贴近人类的对话效果,研发了基于人类反馈的强化学习方法;为了加速模型训练,部署了28万个CPU内核、1万个GPU的超级计算机。通过软件、硬件、技术、语料有效的集成,才使得ChatGPT的知识学习能力获得质的飞跃,造就了当前ChatGPT出色的表现。

3、ChatGPT对文献情报工作的影响

(1)改变文献情报数据组织方式,从表面信息组织到语义内容组织。科技文献情报原始的组织方式往往以题目、摘要、关键词、机构、期刊等表面信息组织为主,较少深入到文献内容中。随着AI技术发展,从科技文献中精确挖掘细粒度知识对象的能力得到提升,以科技文献中研究问题、研究方法、实验步骤、数据资料等深入到文献内容的语义内容组织成为可能。

(3)改变文献情报分析方法,从手工作坊到大规模智能分析。文献情报分析过程包括数据准备、统计分析、观点提炼以及报告撰写等一系列复杂工作,往往由人类手工完成。类ChatGPT人工智能技术已具有观点提炼、内容综述、场景问答、语言翻译、语义分析、智能推荐、辅助决策的潜在能力,可以为情报分析人员提供智能化工具,辅助文献情报分析工作。

(5)对用户阅读习惯的影响,引导人机协同阅读新模式。类ChatGPT技术可能对用户阅读文献资源的方式带来颠覆性的影响。用户输入待读文献资源,智能技术自动实现知识抽取、关系揭示,通过可视化方式进行展现,支持多维度的语义分析,并以交互式的方式应答用户的问题和设定,形成用户与人工智能协同阅读的新模式。

(6)对传统图书情报工作形成挑战,需要统筹谋划图书馆的队伍能力与岗位体系。从基础的书目录入、客服解答、代码撰写到资讯编辑、热点论文推荐、动态感知、情报分析等都会在不同程度上受到人工智能技术的影响,一部分“重复性、技术含量低”的工作将被人工智能优化或替代。同时,人工智能也带来了新的工作机会,更多智能服务的工作需要设置新的岗位,形成新的业务方向,扩展图书情报工作的业务范围。

4、对文献情报领域的建议

ChatGPT重在内容生成,而文献情报工作重在循证。ChatGPT主要解决自然语言处理中内容生成的问题,但文献情报工作的重点并不在此,我们的机会在于如何循证,挖掘支撑可信情报的证据及证据链。文献情报工作在AI时代要找到自己的不同价值取向,有关建议如下:

(1)文献情报领域要把从科技文献内容中挖掘和利用知识的能力作为核心能力来建设。科技文献蕴含人类知识、表达科学机理、揭示科研成果,是国家科技创新的核心战略资源。ChatGPT利用智能技术从海量文本数据中对知识挖掘与利用的巨大成功告诉我们,鉴于科技文献的重要价值,文献情报领域要将从科技文献内容中实现知识挖掘和利用作为核心能力建设。

(2)充分认识到文献情报机构在AI时代的优势和价值。语料是人工智能获取知识的源泉,高价值语料工作是一切人工智能的基础。科技文献蕴含大量知识,文献情报机构应充分认识自己在新时代的使命和定位:AI语料提供者,做好“语料”基础工作。

(3)充分加强人工智能新技术方法的研究和应用。BERT、ChatGPT等人工智能新技术方法突破,表明一代又一代的AI技术还在突飞猛进。文献情报领域不能浅尝辄止。

(4)文献情报领域需积极参与“专业和垂直”知识系统建设。ChatGPT开启了一个新模式,带来了强大的综合性问答系统,而针对科学领域,开展更加深入的专业化知识内容获取与分析的技术方法研究,还存在很多可以开拓的空间。我们需要利用自身专业领域的文献情报优势,积极参与“专业和垂直”知识系统建设。

(5)文献情报领域要努力创新知识服务模式。ChatGPT让我们看到检索和问答已经相互交融,文献情报不能还仅仅停留在检索之上,要充分利用新思路、新技术、新模式、新方法支持知识服务应用。例如,面向知识获取场景的问答式知识检索,面向阅读辅助场景的科技文献集的自动综述等。

(6)应用ChatGPT在情报研究工作上启发创意。ChatGPT能够通过简单提示进行具有创意的创作。在情报研究工作上,用之来启发创意可能是一个不错的选择,但需要专家来指导。

(7)情报的溯源和真实可靠性检测将变得更加重要。当很多“情报”由ChatGPT生成之后,情报的溯源和真实可靠性检测将变得更加重要。避免“滥用ChatGPT”带来错误虚假信息传播、信息泄露、抄袭等一系列问题。

(8)要进行数据资源、基础设施、智能技术一体化的能力建设。ChatGPT这样真正实现应用的AI产品,是软硬件以及各种技术方法有效集成的结果。文献情报工作能力的提升,要统筹数据资源的积累、基础设施的升级、智能技术的研究等,实现各方面从量的积累到质的飞跃,最后进行一体化的有效集成,开发出真正好用、耐用、用户愿意用的文献情报产品。

文献情报需要自我革新,拥抱新技术与新机会。ChatGPT作为一种工具,它本身不会打败人。但是它肯定会带来:会使用这种工具的人打败那些不会使用这种工具的人。传统的文献情报工作依然有价值,但新技术带来改变已是大势所趋。在此背景之下,文献情报领域需要守正创新,图书情报研究必须把握机遇,既要守正继承传统科学研究范式,也要拓展以ChatGPT等新技术助力科学研究。

THE END
1.ChatGPT是什么ChatGPT是聊天机器人吗ChatGPT是什么 ChatGPT是聊天机器人吗 ChatGPT是是由人工智能研究实验室OpenAI在2022年11月30日发布的全新聊天机器人模型,一款人工智能技术驱动的自然语言处理工具,它能够通过学习和理解人类的语言来进行对话,不仅上知天文下知地理,知识渊博,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,但ChatGPT不单是聊天https://g.pconline.com.cn/x/157/15726425.html
2.ChatGPT技术原理解析:从RL之PPO算法RLHF到GPT4instructGPT所以ChatGPT就相当于你写代码或各类问题的私人顾问,而这个私人顾问能瞬间、精准理解你的意图,不会让你像用以前那种聊天机器人经常觉得智障甚至对牛弹琴,加之其背后依托的是人类级百科全书式的资料库,所以有人惊呼:ChatGPT会不会替代Google这类搜索引擎。 https://blog.csdn.net/v_JULY_v/article/details/128579457
3.一文读懂什么是AIGCChatGPT大模型昨天有读者私信我,能否解释一下AIGC和ChatGPT是什么样的关系? 确实,在短短的6个月时间里,AIGC、ChatGPT、大模型等新词汇一下成为媒体热词,加上所谓“人工智能将取代你的工作”之类的焦虑,张栋伟觉得有必要写这样一篇科普。 本文将力求简单化的说明这次人工智能浪潮带来的新词汇和它的意义,带你一文读懂什么是AIGChttps://www.ofweek.com/ai/2023-05/ART-201700-8500-30596590.html
4.支撑ChatGPT的超强算力,到底需要什么样的数据中心?2022年11月30日,OpenAI发布ChatGPT智能聊天程序。ChatGPT能够学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写邮件、视频脚本、文案、翻译、代码、写论文等等。截至2023年2月,ChatGPT已经在全球范围内狂揽1亿名用户,成为当下最火爆的头条热点。欧美各大高校甚至明https://tech.china.com/article/20230225/022023_1229261.html
5.火爆全球的ChatGPT到底是什么?拥有哪些超能力一、什么是ChatGPT ChatGPT是一种基于自然语言处理技术的模型,它是OpenAI研究团队于2019年发布的一款通用的预训练语言模型。这个模型的特点是可以像人类一样进行对话,是一种人机交互的方式。 ChatGPT是一种基于深度学习的模型,它使用了大规模的文本数据集来进行预训练。这个模型可以理解自然语言的语义和语法,并且可以用https://chuangke.aliyun.com/city/yy/industry-news/1625846576993427458.html
6.十分钟理解ChatGPT的技术逻辑及演进(前世今生)1、什么是GPT ChatGPT?里面有两个词,一个是Chat?,指的是可以对话聊天。另外一个词,就是GPT。 GPT?的全称,是Generative Pre-Trained Transformer(生成式预训练Transfomer模型)。 可以看到里面一共3个单词,Generative?生成式、Pre-Trained?预训练、和Transformer。 https://www.51cto.com/article/743197.html
7.chatgpt是什么意思chatgpt详细介绍chatgpt是什么意思?很多网友都不知道,下面本站网为大家带来chatgpt详细介绍,感兴趣的网友一起来看看吧! chatgpt详细介绍 1、chatgpt是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具。 2、chatgpt能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊http://www.ahch.group/ahgl/3716115.html
8.ChatGPT是什么?全面为你讲解ChatGPT!ChatGPT是什么?全面为你讲解ChatGPT! 首先,让我们了解一下ChatGPT的基本概念。ChatGPT是一种基于人工智能技术的自然语言处理模型,它可以理解和生成自然语言文本,并且可以回答各种各样的问题。ChatGPT使用了一种名为Transformer的深度学习架构,它能够在大规模数据上进行训练和优化,从而生成高质量的文本。ChatGPT具有强大的https://www.yutu.cn/news_51983.html
9.最近火爆全网的ChatGPT到底是什么?ChatGPT最近火爆全网,一周的时间,用户过百万;只用了两个月的时间,用户过亿,这是个什么概念,抖音的海外版Tiktok用了十个月的时间才做到的用户过亿,而ChatGPT只用了两个月的时间就做到了。 马斯克跟这家公司有着千丝万缕的关系。比尔盖茨是这家公司的投资人,比尔盖茨说:ChatGPT的出现堪比个人电脑和互联网技术的发https://www.jianshu.com/p/5cea26900c09
10.ChatGPT是什么语言模型?ChatGPT是什么语言模型?在自然语言处理领域中,大型语言模型一直是一个备受关注的研究方向,GPT-3作为当前最先进的语言模型之一,其性能和应用场景已经被广泛研究和应用。ChatGPT作为基于GPT-3.5架构的大型语言模型,其性能和应用场景将是我们研究的重点。 一、ChatGPT的技术特点 https://m.gaodun.com/xinzhiye/1433270.html
11.人人都懂的ChatGPT指南:原理价值应用理解原理是有效应用的第一步。ChatGPT是基于GPT模型的AI聊天产品,后文均简称为GPT。 从技术上看,GPT是一种基于Transformer架构的大语言模型(LLM)。GPT这个名字,实际上是'Generative Pre-trained Transformer'的缩写,中文意为“生成式预训练变换器”。 1.大模型和传统AI的区别是什么? http://www.360doc.com/content/23/0730/08/37102638_1090546201.shtml
12.超火的中文版ChatGPT,你想怎么玩?最近有个超火的软件,从横空出世,刚刚上线一周就从国外瞬间火到国内,有超百万人下载使用,对,它就是ChatGPT,之后它又推出中文版 VSCode 插件,上线仅几天,已有 4 万多次下载,可谓是风头无两。 ChatGPT是什么 顾名思义,chatGPT就是“聊天GPT”,以对话的方式交互,用户问问题,它来回答。乍听起来,似乎也没有很新http://news.hnr.cn/djn/article/1/1621763278710988802
13.火爆全网的ChatGPT是什么?用来干什么?腾讯云开发者社区ChatGPT是什么 美国人工智能研究实验室OpenAI开发的一种全新聊天机器人模型,它能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,并协助人类完成一系列任务。 在短时间内,几亿用户与ChatGPT对话,提出许多刁钻的要求,并将其当做提升效率的工具,用来帮忙检索信息等等,还有用户让其帮忙写论文、小说,甚https://cloud.tencent.com/developer/news/1035972