2022年11月30日,美国公司OpenAI开发了一款由人工智能技术驱动的实用工具,它可以通过自然语言处理(NaturalLanguageProcessing)根据问题为用户提供的各种个性化的解答。这个聊天机器人的全称是“ChatGenerativePre-trainedTransformer”,也就是我们常说的“ChatGPT”。而ChatGPT-3.5,则是OpenAI突破性对话式人工智能的进阶版本,该版本在前一版本的基础上取得了显著进步,重新定义了人类智能与人工智能的交互方式。
一、如何使用ChatGPT-3.5实现数据可视化
本文选用适合新手使用的辅助工具Mermaid为例,了解用户该如何使用ChatGPT-3.5处理和展示数据。
1.辅助工具介绍
主要特点和优势:
(1)简单易用:Mermaid采用直观的文本描述语法,使得创建图表变得简单易懂,无需复杂的代码或图形设计技能。
(2)多种图表类型:Mermaid支持多种图表类型,包括流程图、序列图、甘特图、类图、饼图等,适合不同的应用场景。
(3)跨平台支持:Mermaid图表可以嵌入到网页、Markdown文件、Confluence和其他支持Mermaid的环境中,支持跨平台使用。
2.如何利用ChatGPT-3.5生成可视化图表——以饼图为例
首先,我们需要向ChatGPT-3.5提供你想要进行可视化的数据,此处我们选用一篇英文文献作为原始数据。
案例1:使用ChatGPT在英文文献中提取数据信息并制作恰当的数据可视化图表
首先,在打开与ChatGPT的聊天框后,我们上传一篇英文文献JaneJackson(2015)Preparingstudentsfortheglobalworkplace:theimpactofasemesterabroad,LanguageandInterculturalCommunication中关于参与者实验的部分,要求它提炼上传内容的数据,并将数据内容翻译成中文。
如上图所示,ChatGPT已经提炼并翻译了数据,经过核查,数据的翻译与提取无误。
接下来,我们再次截取关于参与者国别数据的部分,并询问ChatGPT这组数据适合用什么种类的图表来进行数据可视化。ChatGPT为我们提供了两种方案,分别是饼图和柱状图,并解释了两种图表本身的适用范围,以及在本组数据中所能展现的侧重点,以便我们能根据需求来选择其中一种。
(请注意,在使用Mermaind生成图表之前,确保你的编辑器或网页支持Mermaid的语法和渲染)
我们复制了ChatGPT输出的代码,投入到Mermaid网站中使用,顺利得到了饼图。
到此处,饼图图表的制作成果已经出来了。
值得注意到是,在进一步探索ChatGPT-3.5的过程中,我们发现并不是所有的指令ChatGPT-3.5都可以实行。以下通过展示小组在试用ChatGPT出现的错误案例,展示ChatGPT-3.5在运行中可能会出现的反复修改手法,有“迎合胡说”等问题。
当我们尝试询问ChatGPT,要求其生成一段规定饼图各部分颜色的代码,使饼图变得更美观时,ChatGPT向我们提供了一段代码。根据新生成的代码,我们再次回到Mermaid尝试。尽管饼图整体的颜色明度变小,看起来更和谐,但并没有达到我们的预期,且Mermaid页面跳出error字样,显示错误。
此时,我们假设错误的原因可能是由于ChatGPT没有正确理解我们的需求,我们返回ChatGPT,向它进一步明确我们的要求,提出用Mermaid代码将饼图颜色调整为同一颜色的不同色调,ChatGPT根据要求调整了代码的写法。
但代码运行再次显示错误,饼图的颜色与前一调整颜色代码的结果完全一致。我们追问ChatGPT如何修改显示错误的代码,它改变了说法,表示Mermaid无法实现渐变色效果,建议我们使用其他的数据可视化工具并做了推荐。同时它再次推荐如果不需要渐变色效果,可以把颜色调整一致,但其代码形式与前文一致,Mermaid运行仍然显示错误。
我们再次询问以确认Mermaid到底是否能实现颜色的调整,它提出了一个新的代码形式,尝试后证实错误。经过4次问答与3次代码形式修改,我们最终确认Mermaid无法实现颜色修改。同时得出结论,ChatGPT存在反复修改手法,有“迎合胡说”等缺点,在离真正高效、准确实现从文献中提取数据,并完成可视化图表或者给出代码在插件以及辅助工具中实现数据可视化功能上,存在很大的进步空间。
3.如何利用ChatGPT-3.5生成可视化图票——以甘特图为例
案例二:使用ChatGPT3.5帮我画一个备考全国二级计算机考试的甘特图。
首先,提问“备考中国的全国二级计算机考试一般需要多久”
于是,使用者需要提出更加明确的任务需求:“根据上述备考经验,你可以用Mermaid.is帮我做备考中国的全国二级计算机考试的甘特图吗,考试日期为9月23日至9月25日。”
最终才生成了一个达到我们要求的甘特图。
二、使用体验总结
在使用ChatGPT3.5的过程中,可以感受到其整理分析总结文本的强大能力,但对于使用其进行数据可视化仍然是一个费劲的工作。ChatGPT3.5仍然具有很大的局限性。由于ChatGPT3.5无法安装插件,需要将其生成的代码放到其他平台上进行图片生成,并且其将文本信息转换成可视化图像中信息的能力较弱。
除本文小组在实操中发现的问题以外,为使信息更加全面,我们也收集了网络平台上的一些用户反馈。总体来讲,ChatGPT-3.5作为目前前沿人工智能大语言模型,可以基本满足非专业数据处理者的日常需求。
而根据OpenAI公司的评估,ChatGPT-3.5也具备较强的数字处理能力。通过模拟真实考试的条件和评分细则,OpenAI评估了ChatGPT在学术和专业考试中的表现。实例证明,ChatGPT在数据处理水平的专业水平较高,足以支撑基础的数据处理。
示例2:OpenAI官网论文截图
但同时,ChatGPT-3.5的问题也不容忽视,要求用户批判性思维能力和具备向AI准确提供指令的能力。在收集用户评价的过程中,我们发现不少用户均反映ChatGPT-3.5无法处理较高水准的数据处理任务,但会出现ChatGPT-3.5提供不准确的处理结果迷惑用户的情况。一篇发表在Axiv上,研究ChatGPT-3.5与ChatGPT-4.0论文表示,“研究发现,对于简单的算术、代数表达式或基本逻辑谜题,聊天机器人可以提供准确的解决方案,尽管不是每次尝试都能成功。但是,对于更复杂的数学问题或高级逻辑任务,虽然它们的答案通常写得‘令人信服’,但可能并不可靠。”(Ithasbeenfoundthatforstraightforwardarithmetic,algebraicexpressions,orbasiclogicpuzzles,chatbotsmayprovideaccuratesolutions,althoughnotineveryattempt.However,formorecomplexmathematicalproblemsoradvancedlogictasks,theiranswers,althoughwritteninausually"convincing"way,maynotbereliable.)
不仅如此,ChatGPT-3.5在进行指令分析时,存在无法准确理解指令的情况。此时要求使用者进一步精确指令,并仔细检查生成结果是否存在忽略重要初使条件的条件的情况。此时建议使用者明确指令的基础条件和需求。
三、ChatGPT-3.5的背景介绍
ChatGPT-3.5的基础信息
ChatGPT-3.5是人工智能技术驱动的自然语言处理工具。这个模型基于Transformer架构编写而成,它以其强大的理解文本能力和生成各种邮件、视频脚本、文案、翻译、代码的能力而闻名。OpenAI通过它用大量数据进行广泛的预训练,并让它进行强化学习然后微调,ChatGPT-3.5已成为一个强大的对话伙伴,在从数据处理到协助创意写作等一系列任务中表现出色。
独特功能与进步:
(1)坚实的数据基础:ChatGPT-3.5拥有大量参数,在此基础上,该模型可以更深入地理解语境,从而做出更准确、更符合语境的回复。
(2)多模态输入:除了纯文本,ChatGPT-3.5还善于处理多模态输入,如图像和语音数据。这一功能可以更全面地理解用户的询问,打造更身临其境、更自然的对话体验。
(3)语境敏感性:ChatGPT-3.5具有出色的语境感知能力,能在扩展对话中保持连贯性。它能把握细微差别并回想之前的互动,创造出流畅逼真的对话,与用户产生共鸣。
(4)零点学习能力:ChatGPT-3.5展示了令人印象深刻的适应性,因为它可以从少数几个示例中学习(少量学习),也可以执行未经明确训练的任务(零点学习)。这一功能简化了人工智能培训,使用户能够更高效地实现目标。
四、总结
总体上来说,新手小白可以借助ChatGPT3.5完成基础的数据可视化的代码书写,本文以饼图与甘特图为例展示了无编程基础的使用者该如何利用ChatGPT-3.5实现数据可视化。同时,本文也通过展示出使用过程中的障碍,表明了ChatGPT-3.5的功能缺陷。在使用过程中,我们建议使用者尽量详细写明自己的需求,并在使用过程中不断复核与检查,以保证数据的准确性。
北京大学暑期课《数据新闻》作业
图文|你说的都对组
组员|尹伊茗吴茜文党一温馨叶珂妤王嘉璐
原标题:《工具|新手视角打开ChatGPT+Mermaid实现数据可视化》