自美国AI公司OpenAI于2022年11月30日发布全新通用型对话系统ChatGPT并免费开放网页端试用功能以来,经过短短5天,活跃人数就超过100万,2个月的活跃人数就达1个亿,打破了史上增长最快的消费者应用程序的记录。ChatGPT在写提纲、编邮件、优化语句、合成代码、修复Bug等要求下的内容生成,不仅效果优异,在完成速度上也有着优越的表现,展现了ChatGPT文本生成能力的强大应用场景。与之前推出的小冰、小度、Siri等对话机器人相比,ChatGPT的回复更为智能,大多数情形下能够结合上下文形成“有逻辑的对话”,实现了从“人工智障”到“强人工智能”的跨越性转变。
2023年3月15日凌晨,OpenAI再次推陈出新,发布多模态预训练大模型GPT-4。OpenAI声称:“这是OpenAI努力扩展深度学习的最新里程碑。它接受图像和文本输入并进行文本输出,虽然在许多现实场景中它尚不如人类,但在各种专业和学术基准上已表现出与人类相当的性能”。这意味着生成式人工智能将不限于文本领域,借助人工智能直接生成图像、视频等素材的愿想正在逐步迈向现实。
ChatGPT的横空出世,使人工智能的发展进入全新的阶段。英伟达CEO黄仁勋表示“ChatGPT相当于AI界的iPhone问世”。那么,ChatGPT由何而来,为何而生,又向何而去?在这个过程中,人工智能本身面临怎样的风险与挑战,又会对人类社会生态和就业环境造成怎样的影响?对这些问题的解答构成了本文的逻辑主线。
一、由何而来——ChatGPT的发展历程
基于GPT3.5并加入监督数据微调得到的ChatGPT,可以通过学习和理解人类语言,用对话的方式进行交流,这种形式不仅能够提升用户的交互体验感,而且能够根据用户反馈进行回答调整和细化,从而更好地理解和满足用户的具体要求。ChatGPT在对话、写作等多方面的优秀表现,掀起了预训练大模型的浪潮,学界和业界纷纷开始迅速启动并跟进研制自己的大规模预训练语言模型,以追赶新一代AIGC(AIGeneratedContent)的风口浪尖。与此同时,OpenAI也在不断改进GPT模型的训练和应用方式,除ChatGPT外,OpenAI还开发了一个能够根据文字描述生成相对应图像DALL-E的模型。
ChatGPT迅速引爆了新一轮AI军备竞赛。谷歌于2023年2月7日宣布即将推出由LaMDA模型支持的对话式人工智能服务Bard,在此之后仅仅24个小时,微软迅速上线了基于ChatGPT类技术的NewBing,并计划将ChatGPT集成到Office办公套件中。除此之外,苹果、亚马逊、华为、阿里巴巴等企业也均明确表态正在进行类ChatGPT模型研发与布局。在这个有望超万亿元的AIGC超级赛道里,谁能引领技术先机,谁就将率先掌握定价权,迎来庞大的市场份额和商业空间。
二、为何而生——ChatGPT的广阔应用场景
ChatGPT内容生成的智能性和涉及领域的广泛性给人类带来了极为多元的应用场景。本文带来三个较为实用的个人使用案例,但ChatGPT的用途远远不止于此,更加具有针对性的应用场景有待进行探索与尝试。
应用案例之一——协助撰写商务邮件
输入提示参考:假如你现在是一名外企员工,请写一封邮件提醒同事尽快完成流程审批,要求按照商务英文标准。
应用案例之三——代码开发
GPT4的发布会上,OpenAI的总裁和联合创始人GregBrockman展示了GPT-4的强大编程技能:他在草稿本上用纸笔画出一个非常粗糙的草图,并拍照告知GPT-4需要按照图片的效果生成网站代码。令人震惊的是,GPT-4用时十秒左右就构建出了功能齐全的html/css/JavaScript网站。对于程序员而言,利用ChatGPT缩短开发流程、进行代码纠误等将是非常实用的功能。
输入提示参考:我需要构建如图所示的网站,请生成网站代码。
三、向何而去——ChatGPT的未来增长空间
现阶段,大规模预训练语言模型的应用场景还主要体现在自然语言处理(NaturalLanguageProcessing,NLP)上,因此在引擎搜索、聊天机器人、航程辅助等领域应用广泛。在可见的将来,智能家居、工业视觉、行业化机器人等多模态方案将逐步落地,医疗、教育等AI行业专家,工作、购物等AI助理也将走入人类生活。进一步地,结合复杂多模态方案的大规模预训练语言模型将完整地具备与世界交互的能力,将在通用机器人、虚拟现实等领域大放光彩。
可以预见的是,从文本到图像的自动生成可能只是OpenAI发挥创造力的开始,音频、视频、3D动画……人们会逐渐意识到,阻碍人工智能产出的将不再是技术或算法,而是人们的想象力。
四、风险向内——ChatGPT带来的挑战
在ChatGPT不断迭代更新的同时,对AIGC产物所存在挑战的讨论也与日俱增。这一部分由ChatGPT当前的技术限制所引发,另一部分则是由人类对ChatGPT的不当使用所导致。本文以ChatGPT可能带来的隐私泄露、信息伪造和伦理道德风险为例,洞察AIGC的发展给人类造成的可能挑战和并尝试给出应对举措。
信息伪造。由于ChatGPT不具有对错判断能力,也无法借助合理依据对生成内容进行可信度的验证,因此可能会生成虚假信息,例如伪造用户的对话内容、创建虚假新闻报道等,从而对公众造成误导。若这些虚假信息被ChatGPT快速合成并广泛传播,将造成网络虚假信息泛滥,网络用户将更加难以甄别这些信息的真伪。为此,ChatGPT未来应当持续提升对合成信息真伪的识别能力,并采用图像识别和语音识别等多种技术手段尝试过滤虚假信息。
五、辐射向外——就业替代和社会极化风险
随着人工智能的不断发展,面向消费者的产品也不断推陈出新,无论是AI生成图画,还是直接生成文本内容,都展现出了其强大的深度学习能力和广阔的发展空间。在人工智能给人们带来新的惊喜的同时,人工智能是否会造成就业替代这个话题也再一次冲向风口浪尖。
根据人大国家发展和战略研究院的测算,人工智能对制造业和批发零售业两个行业的平均替代率分别为43%和57%,由于我国企业就业人口多半在这两个行业就业,将有约45%的城镇就业人口存在可替代的风险。以重点行业为例,针对金融行业,人工智能技术已经深入前、中、后台全过程,智能化建设的推进使银行业务线下人工处理率不断下降,股票交易决策支持、研究分析、风险建模和智能投顾的落地也将对传统金融从业者造成替代;针对医疗行业,人工智能技术可以通过分析X光、CT扫描、MRI等医学影像图像,更快速、更准确地诊断患者病情。在电子病历管理和医疗保险审核方面也将展现出极大的优势;针对制造业,自动化生产线、机器人存储、搬运和配送以及数据分析优化企业决策等都将对传统制造业工作造成替代。
常规性工作岗位的大量替代导致社会财富聚集在少部分高精尖领域人群手中,可能会加剧我国贫富两极分化,造成社会及政治不平等。简单、重复性的人力劳动被人工智能大面积取代,而高技能、高收入的工作将更多地集中于人工智能技术领域。此外,许多科技公司和大型企业开始垄断数据和技术资源,拥有更多的财富和市场优势,形成“赢者通吃”效应。这进而导致中小型企业和创业公司在竞争中难以生存,而大型企业和技术巨头则可以进一步扩大自己的市场份额和利润,加剧贫富差距和社会分化。