机器学习时代的人类学习——ChatGPT引发的教育哲学反思余明锋

机器学习时代的人类学习——ChatGPT引发的教育哲学反思

摘要:ChatGPT在自然语言处理上的突破开启了人工智能通用化的大门。当下取得突破的,不是基于规则的早期人工智能,而是基于机器学习的新型人工智能。机器学习乃是算力、数据和算法三者的聚合,机器学习时代的文明界面由此从人类才能识别的文字转变成了机器能够识别的数据。目前有关ChatGPT和教育人工智能的讨论,多着眼于机器学习的短期效应,我们有必要以机器学习时代的眼光理解ChatGPT的挑战,以此为契机审视人类学习的重组。机器学习在带来种种挑战的同时,或许能让教育机构解脱于生存机构的纠缠,回归“学以成人”的文明理念。

关键词:机器学习;ChatGPT;教育人工智能;人类学习的重组

所谓教育哲学,首要的任务是反思何谓教育、何谓学习。这种反思不是一蹴而就的,因为教育和学习的具体含义有其时代性,必定随时而变。当朱熹注解《论语》时,“学而时习之”的现实意涵已然大大不同于孔子的时代,因为朱熹的时代已经有了印刷术和科举制度,这时候主要学习的不再是礼仪的操练,而是经典的记诵和注解。①进入21世纪,其意涵更是大不相同,学习的主要任务不是深入四书五经,而是融入现代知识体系,成为现代国家的公民。教育哲学的反思因此必定包含了一个历史哲学的维度,必定要在时代剧变中重新定义教育和学习,而首要的任务是对时代本身的重新界定。②

“随时而变”在这个意义上并非随波逐流,而恰恰是要在加速流转、躁动不安的时代洪流中寻求清晰的定位。历史哲学的眼光和方位感可以让我们一方面敏感于AlphaGo、ChatGPT这样的新事物,另一方面又不至陷入媒体的夸大其词所营造的恐慌情绪。这个意义上的思想者在积极介入的同时处变不惊,着眼于时代深处远为沉静的涌动来理解河面上的激流。

一、机器学习的概念

ChatGPT就是2023年的这样一股激流。人工智能在自然语言处理上的突破意义重大,约略来说,在教育问题的讨论中,有两点值得着重指出。

其次,这个正在到来的人工智能时代,准确来说,是一个机器学习(machinelearning)的时代。因为当下取得突破的人工智能,不是基于规则的早期人工智能,而是基于机器学习的新型人工智能。所谓基于规则的早期人工智能,是“让计算机执行某项任务的传统方式”,即“写下算法”或“一系列向计算机发送的指令”,以此直接规定计算机应如何执行任务。[2]而机器学习“涉及大量数据输入以预测全新的结果,而绝非直接命令得到的直接输出”。[3]换言之,“每个算法都有输入和输出:数据输入计算机,算法对其进行处理,然后输出结果。机器学习将这种情况颠倒过来:输入数据和期望的结果,而输出的是将前者转化为后者的算法”[4]。机器学习所用的算法是“生成其他算法的算法”,是自动化本身的自动化。

机器学习的方法分为三种,分别是监督学习、无监督学习和强化学习。所谓监督学习,用斯图亚特·罗素(StuartJ.Russell)和彼得·诺维格(PeterNorvig)的定义来说,就是通过“观察一些输入和输出的例子之后,获得了从输入映射到输出的函数”[5]。因此监督学习处理的是被标记过的数据,而无监督学习是在没有标记的数据中、没有明确反馈的前提下,从海量的输入中识别出模式。强化学习是让机器“从一系列的强化,即从奖励和惩罚中学习”。

二、机器学习的时代

另外,机器学习事实上已在消减人类个体的主体性:“当我们渗入、穿戴或携带传感器,或当身体植入传感器,向传感器输出我们的生理和行为的历史数据时,我们身体经验的理念发生什么变化呢”[9]如果机器学习通过数据处理可以绕过人类的自我意识,得出有关人类的更为可靠的知识、做出更为可靠的预测,那么人不是正在经历一种自身的客体化变形吗无论如何,我们今天事实上迫切需要一种扩展的主体性理论,将人类之外的主体性力量纳入考察范围。而机器学习的概念正是这样一种主体性理论的重要组成部分。

三、ChatGPT与教育人工智能

之所以着重提出“机器学习时代”的概念,一方面是为了更准确地界定这个时代,尤其是这个时代的知识状况和生存境况,另一方面是相应地提出人类学习的概念。未来的人类已经无法脱离机器来理解自身,未来的人类学习同样无法脱离机器学习来得到理解。这个未来甚至已经到来。

四、人类学习的重组

在这样一个大变革的时代,我们大有必要在短期考量之外作长远的思虑,以教育哲学的眼光反思机器学习时代的人类学习。有关于此的反思是以人类未来为主题的大尺度思考,具有一种“预思”和“猜度”的性质,因而笔者在此仅仅满足于举出以下四点,作抛砖引玉之论。

其次,在机器学习的时代,有必要重审文理之间的区隔。一方面,科技素养和数据素养当成为未来人类的基本素养,“因为编码是数字世界的通用语言,所以每个人都应该熟悉它”[16]。如果不懂编程语言,也就意味着无法进入机器学习时代的文明界面,无法对时代的运行机制形成一种直觉和判断,因此无法成为未来世界的合格公民。可在另一方面,技术专家也亟需突破自身的盲区。如萨斯坎德所言:“在科技公司内部,几乎没有工程师身负努力思考其工作的系统性后果的任务。他们中的大部分只需要解决某些分散的技术问题就可以交差了。”[17]如果是这样的技术专家在推动人类的发展,那所谓的“进步”难道不正意味着巨大的冒险像机器学习这样惊人的技术突破会不会正以光明的名义带来黑暗

从另一个角度来说,软件工程师可谓机器学习时代的基建工人,当机器学习渐入正轨,软件工程师难道不也正在努力建造一个不需要自己的世界“人们常说,软件正在吞噬世界,所以我们需要软件开发人员。但当软件吞噬完世界后,我们需要什么就不太清楚了。当机器人学会自己编程时会发生什么”[18]技术专家同样需要重获人文素养,摆脱“工具人”的地位。

再次,学习的重组也意味着教育制度的重构。现代教育制度是基于启蒙运动以来的知识理念和工业社会的组织架构而建立的,比如划分专业就与整个工业社会的架构分不开。当技术的发展使这些理念和架构都面临失效的时候,基于此而建立的现代教育制度恐怕也到了一个亟需变革的时刻。如奥恩所言:“美国的教育体系在很大程度上是为了满足19世纪和20世纪工业经济体系的需要而设计的,因此在工厂、官僚结构和分类账簿充斥的世界里,它往往强调这个世界里最有价值的机能。”[19]这样的状况显然决不局限于美国的教育体系,而是普遍表现于全世界的教育体系当中。可如果第二次工业革命所建立的经济体系已渐成历史的陈迹,与之相应的教育体系难道不是成了无本之木难道不是到了亟待改革的时刻

最后,在有关“人工智能与教育”的思考中,论者往往以人工智能革命所潜藏的就业危机为出发点,以“工作的未来”为准心来思考和设计“教育的未来”。这本身无可厚非,就今天的情境来说,这毋宁是一种负责任的教育思考。可我们有必要追问,这是否恰恰仍然受缚于工业时代的教育观念和学习观念如果说机器学习蕴含着某种解放的潜能,那是否有可能将我们从现代的工作观念中解放出来事实上,早在第二次工业革命之初,尼采就惊呼教育的遗忘,因为真正的“教育机构”被混同于“生存机构”了,前者是“纤足的、娇贵的天国仙女”,后者是“实用的女佣”。[20]而机器学习能否促逼我们跳脱尼采所咒骂的“19世纪的野蛮”,让未来的人类回归“学以成人”的文明观念这或许是一个太过美好的希望。不过,我们不妨援引尼采的话来总结这篇教育哲学反思,也让这篇关于机器学习的思考不至变得过于灰暗:“请注意,我的朋友,请不要混淆了两类事情。一个人为生存、为了生存斗争必须进行大量学习,但他作为个体为这个目的所学所做的一切,都与真正的教育毫无关系。只有在远高于这种困境、远离生存斗争和必需之物的大气云层之上,真正的教育才开始。”⑦

注释:

①虽然朱熹所强调的是心性的觉悟,可他的《四书章句集注》还是成为流传几百年的标准教科书。有关“学而时习之”,朱熹的解释与其说在追踪孔子时代的原义,不如说是在为理学作印证:“人性皆善,而觉有先后,后觉者必效先觉之所为,乃可以明善而复其初也。”(参见朱熹:《四书章句集注》,中华书局2011年版,第49页。)

③有关这一区分,可参见徐英瑾:《人工智能哲学十五讲》,北京大学出版社2021年版,第92-93页。当然,还可以进一步追问:如果背后无真实心智可言,那么所谓“通用人工智能”又能通用到何种程度会不会只能停留于火花状态

④有关技术时代的广义和狭义的界定,参见余明锋:《还原与无限》,上海三联书店2022年版,第60页和第92-93页。

⑤参见韦恩·霍姆斯、玛雅·比利亚克、查尔斯·菲德尔:《教育中的人工智能》,冯建超等译,华东师范大学出版社2021年版,第94页。有关数据的重要性,可参见萨斯坎德的论述:“数据对机器学习来说是至关重要的,如果数据太少,机器学习算法的发展便会受阻,如果数据足够多,‘一种只有几百行的学习程序就能轻松产生千万行的程序,而且它能在不同问题上反复使用’。这就是数据被称为‘新煤矿’,而收集数据的人被称为‘数据挖掘者’的原因。”(杰米·萨斯坎德:《算法的力量》,北京日报出版社2022年版,第10页。)不过,数据之所以如此重要,是因为有了相应的算力和算法;反之亦然。因此单单强调三者之一都是片面的。

⑦参见韦恩·霍姆斯、玛雅·比利亚克、查尔斯·菲德尔:《教育中的人工智能》,冯建超等译,华东师范大学出版社2021年版,第99-100页。当然这只能算是教育人工智能的史前史,因为那时候还不存在所谓的人工智能。

参考文献:

[1]徐英瑾.人工智能哲学十五讲[M].北京:北京大学出版社,2021:76,93.

[2][17]〔英〕杰米·萨斯坎德.算法的力量[M].北京:北京日报出版社,2022:8,vii.

[3][6][15]〔美〕韦恩·霍姆斯,玛雅·比利亚克,查尔斯·菲德尔.教育中的人工智能[M].冯建超等译.上海:华东师范大学出版社,2021:94,233,33.

[4]Domingos,P.(2015).Themasteralgorithm:Howthequestfortheultimatelearningmachinewillremakeourworld.London:AllenLane,6.

[5]Russell,S.J.,&Norvig,P.(2022).Artificialintelligence:Amodernapproach.GlobalEdition,Pearson,671.

[7]〔英〕阿诺德·佩西,白馥兰.世界文明中的技术[M].北京:中信出版社,2023:195、366.

[8][9]〔意〕柯西莫·亚卡托.数据时代[M].何道宽译.北京:中国大百科全书出版社,2021:87,46.

[10]García-Pealvo,FranciscoJosé.(2023).TheperceptionofArtificialIntelligenceineducationalcontextsafterthelaunchofChatGPT:DisruptionorPanicEducationintheKnowledgeSociety,24,3.

[11]Adiguzel,etal.(2023).Revolutionizingeducationwith:ExploringthetransformativepotentialofChatGPT.ContemporaryEducationalTechnology,15(3),1.

[12][13][14][16][18][19]〔美〕约瑟夫·奥恩.教育的未来[M].李海燕,王秦辉译.北京:机械工业出版社,2018:62,64,79-84,62,52-53,66.

[20]〔德〕尼采.论我们教育机构的未来[M].彭正梅译.北京:商务印书馆,2019:76.

HumanLearningintheAgeofMachineLearning:ReflectionsonChatGPTandEducationalPhilosophy

YuMingfeng

Abstract:ThebreakthroughofChatGPTinnaturallanguageprocessingopenedthedoortothegeneralapplicationofartificialintelligence.Itisnotbasedonrulessuchastheearlyartificialintelligence,butbasedonmachinelearningasthenewartificialintelligence.Machinelearningcombinescomputingpower,data,andalgorithms.Theinterfaceintheeraofmachinelearninghasthuschangedfromtextsthathumanscanrecognizetodatathatmachinescanrecognize.ThecurrentdiscussionsonChatGPTandAIEDfocusontheshort-termeffectsofmachinelearning.ItisnecessaryforustounderstandthechallengesofChatGPTfromtheperspectiveofthemachine-learningeraandtakethisopportunitytoexaminethereorganizationofhumanlearning.Whilemachinelearningbringsvariouschallenges,itmayalloweducationalinstitutionstodisentanglethemselvesfromsurvivalinstitutionsandreturntothecivilizedconceptof"learningtobecomehuman".

THE END
1.一.ChatGPT只有有限的技术壁垒机器学习的核心算法是都是公开的机器学习的核心算法是都是公开的 ChatGPT的核心算法是Transformer Model 这还是谷歌2017年发布的算法 调整参数是一个非常困难的工作 但这本身并不是一个壁垒 比如量化交易公司的算法是绝密且困难的工作 但这本身并不是壁垒 只有专利是真真正正的壁垒 只有专利意味着必定后无来者 https://xueqiu.com/3976999949/242252671
2.ChatGPT模型采样算法详解gpttemperatureChatGPT模型采样算法详解 ChatGPT 所使用的模型——GPT(Generative Pre-trainedTransformer)模型有几个参数,理解它们对文本生成任务至关重要。其中最重要的一组参数是temperature和top_p。二者控制两种不同的采样技术,用于因果语言模型(Causal language models)中预测给定上下文情景中下一个单词出现的概率。本文将重点讲解tehttps://blog.csdn.net/jarodyv/article/details/128994176
3.chatgpt背后的算法是基于一个transfotmer,通过基于自身反馈的强化学习来chatgpt背后的算法是基于一个transfotmer,通过基于自身反馈的强化学习来进行模型训练 参考答案:不准确。ChatGPT背后的算法是基于一个名为GPT(Generative Pre-trained Transfo 点击查看答案http://www.ppkao.com/kstkai/daan/c5832b0df93141779498dfcd9f6b8378
4.剧中的压缩算法是否可行,我问了Chatgpt(硅谷第一季)剧评剧中的压缩算法是否可行,我问了Chatgpt 回答如下: 在《硅谷》剧中,主人公理查德(Richard)和他的团队开发的压缩算法“波多黎各”(Pied Piper)是一种非常强大的数据压缩算法,可以将音频、视频等数据压缩到非常小的尺寸,同时保持高质量的输出。虽然这个算法在剧中取得了很大的成功,但是从技术角度来看,这个算法在现实中https://movie.douban.com/review/15003427/
5.强人工智能视域下新闻传播的变革与应对以生成式人工智能ChatGPT基于ChatGPT信息资源获取和应用能力,它极大可能成为继搜索引擎、网络浏览器等互联网入口之后的新入口,与用户建立更加紧密的联系,创造出全新的人机关系,并直接影响用户的新闻信息搜集、获取和消费。 ChatGPT实现内容分发个性化和情感性结合,放大传播效果。在弱人工智能阶段,新闻个性化分发基于数据、算法和用户“画像”进行https://www.cnii.com.cn/gxxww/zgdxy/sdsp/202308/t20230831_500087.html
6.算法对付算法,斯坦福大学严查ChatGPT代写论文算法对付算法,斯坦福大学严查ChatGPT代写论文 发现更多热门视频 淄博职业学院通报“学生突发疾病禁止男性医护人员进入宿舍”:已达成和解 第一帮帮团6942次播放 美国网民拍到两架F-117低空飞行 空警世界3.9万次播放 这是在巴基斯坦的网友拍摄到,他看到几个人手搓客车… 戏剧人生窥世8800次播放 张本:发哪你都能接,https://video.sina.cn/finance/2023-01-29/detail-imycvtrt0393619.d.html?pt=mlist
7.中国版ChatGPT能否后来居上?综合全部资讯一言以蔽之,中国不仅具有在数据、算法、算力和应用方面追赶海外AI技术的硬实力,更拥有长期为AI时代保驾护航的文化基因。或许这种科技的潜力会让我们在AI技术领域后来居上,但是这种积淀了几千年的中华智慧,才是中国版ChatGPT走向世界的终极法宝。 当沸腾的水壶在瓦特眼里勾勒出蒸汽机的雏形,有谁会意识到工业革命的车轮https://www.p5w.net/roll/complex/202311/t20231114_5844656.htm
8.ChatGPTChatGPT是一款建立在云计算、海量数据库、人工智能算法架构和深度神经网络基础之上开发的聊天机器人程序,它不像传统的搜索引擎一样复制和拼凑网上已有的信息给用户。相反,它提供的回答是有逻辑的、生动的,有上下文关联的。 总结一下,ChatGPT是美国人工智能研究实验室OpenAI新推出的一种人工智能技术驱动的自然语言处理工具https://www.jianshu.com/p/805abc3dcaae
9.是什么让ChatGPT变得如此聪明?仍然未知的大语言模型“能力涌现但这次以ChatGPT为代表的一众大语言模型,突然突破了这个门槛,变得非常“聪明”。当然背后的原因有很多,比如自监督学习、Fine-tuning策略等等,但有一个重要的底层变化——大语言模型的“涌现”(Emergent)现象,就是说一些业界从未想象到的能力,例如基础的社会知识、上下文学习(ICL)、推理(CoT)等等,在训练参数和数据量https://36kr.com/p/2210585582301824