“空想”未必不能产生“真理”数学牛顿推理悖论

机器的学习能力,对我们来说已是习以为常,甚至有些人会觉得,“只要数据足够,机器什么都能学”。但通常我们谈论的学习,都是建立在“基于外部观察”的框架之下。除了常见的阅读、听课等典型学习场景,还有一种在我们内心深处(思维内部)进行的学习,这就是所谓的“通过思考学习(learningbythinking,LbT)”。

想想看,这种现象在日常生活中无处不在:科学家通过思考实验获得新见解、司机通过心智模拟发现如何绕开障碍,或者作家在尝试表达自己的想法时学到新知识……这些例子中的学习,都是在没有新的外界输入的情况下发生的。随着计算机科学的发展,LbT现象变得更加明显。

例如,GPT-4在解释过程中纠正了一个误解,并由此得出正确的结论,整个过程中未受任何外界反馈影响。当大型语言模型(LLMs)被要求“逐步思考”或模拟思维链(Chain-of-Thought)时[1],同样可以在没有外部纠正的情况下提供更准确的答案。

GPT-4对话截图。图源:GPT

但LbT常被认为是一种“悖论”。这一方面是因为,从某种意义上说,学习者并没有获得新的信息——他们所能利用的,只是已存在于脑海中的元素;而另一方面,学习又确实发生了——学习者获得了新的知识(比如数学问题的答案)或新的能力(比如回答新问题的能力或进行新推理的能力)。

那么,这种近乎“空想”的学习行为所产生的结果,能否被视作“真理”呢?在下定结论前,让我们先回顾一下支持LbT的证据。

Lombrozo,Tania."Learningbythinkinginnaturalandartificialminds."TrendsinCognitiveSciences(2024).

01四种典型的LbT学习方式

我们先从LbT的四个实例来进行探讨,即通过解释、模拟、类比和推理进行学习。当然,LbT并不仅限于这四种学习方式——一方面,还存在其他的LbT方式,例如通过想象学习;另一方面,这些学习方式均可细化,例如当提到通过解释进行学习时,目的论解释与机制性解释又有所差别。

事实上,由于学习过程与注意力、记忆等其他认知机制之间存在错综复杂的关系,因此很难对其进行根本的分类。相反,我们探讨的这四种学习过程,可以帮助我们理解LbT的普遍性(ubiquity)和长处,平行比较人类思维与人工智能。

学习的不同类型.图源:[2]

(1)通过解释进行的学习

类似的思路也在AI研究中得到应用,例如通过生成自我解释,AI系统从训练集中提取信息,从而实现泛化。最新研究还表明,深度强化学习系统在生成任务答案的同时,若能够生成针对答案的自然语言解释,其在关系推理和因果推理任务中的表现将优于没有进行解释预测的系统,甚至优于那些将解释作为输入的系统。这些系统并非仅依赖简单特征,而是能够从复杂数据中总结出可泛化的信息。

图源:GPT

(2)通过模拟进行学习

想象有三个齿轮水平排列,最左边的齿轮顺时针旋转,此时最右边的齿轮会向哪个方向转动?

大多数人会通过“心理模拟(mentalsimulation)”来解决这个问题:在脑海中构建齿轮运动的画面,观察每个齿轮的转动方向。纵观科学史,许多领域的思想实验亦是经典的心理模拟。例如,爱因斯坦通过模拟光子与火车的运动来探讨相对论,伽利略则通过模拟物体下落的过程来研究重力。这些心理模拟与思想实验,无需依赖外部新数据,便能带来深刻的见解。

和解释性学习类似,心理模拟可以是纠正性的,也可以是生成性的。

类似的模拟过程也广泛应用于AI领域。例如,在深度强化学习中,“基于模型的训练方法”利用环境表征生成数据来训练策略,这与人类的心理模拟十分相似。某些AI算法通过“深度想象”或模拟多组决策序列,来近似求解最佳方案。在人类和AI中,模拟都能生成“数据”,为学习和推理提供重要输入。

图源:CoreyBrickley

(3)通过类比推理和比较进行学习

在构建自然选择理论时,达尔文类比了人工选择与生物进化,由此推导出自然选择中的变异机制。这样的类比推理在科学研究中很常见,尤其当研究者对比较的对象双方有一定了解时,通过类比思维可以产生新的见解,支持“通过思考学习”。

通过类比进行的学习并不完全依赖自主思考,还结合了外部信息,因此学习结果既反映了研究者提供的信息内容,也反映了参与者的类比思维能力。然而,有些研究将类比思维的影响独立出来,所有参与者接收相同的类比信息,但只有部分被提示在解决新问题时运用这些信息。

例如,一项数学学习研究表明,被试被提醒进行样本比较的次数越多,他们越不易被题目表面的相似性误导,这展示了类比学习的纠正性作用。另一项实验要求被试找出两组机器人之间的相似性和差异,结果发现,只有那些积极进行比较的参与者更可能发现微妙的规则,展示了类比思维的生成性作用。

通过类比推理,不仅可以纠正错误,还能激发更深层次的思考,发现新的概念或规则,无论在人类学习还是人工智能中,都是重要的学习机制。

图源:NGSARTDEPT

(4)通过推理进行学习

即使是看似简单的推理过程,也需要正确的信息和逻辑处理。例如,我可能知道今天是星期三,也知道“如果今天是星期三,就不应该在某个校区停车”,但由于各种原因,我可能会忽略这一逻辑关系,而把车误停在了禁止停车的地方。这说明,即使逻辑成立,推理时仍需额外的注意和处理能力。

更复杂的推理,则需要更深入的思考。比如:

在现实中,这样的推理结论可能难以接受,这表明有效的推理不仅需要逻辑推导,还需要反思和实际判断。

推理也能起到纠正作用[4]。一项研究让参与者评估推理问题回答的论证,他们并不知道这些论证来自于自己此前的回答,结果显示,三分之二的参与者能够正确否定自己之前做出的无效推理。这类纠正性的推理在认识错误直觉中发挥着重要作用。比如“认知反思测试(cognitivereflectiontest,CRT)”中的经典问题“球拍与球”:球拍和球的总价为1.10美元,球拍比球贵1美元。直觉答案是0.10美元,但正确答案是0.05美元。推理得出正确答案需要克服初步的直觉反应,进行更严谨的思考。

图源:mannhowie.com

在人工智能领域,传统符号架构的推理通常依赖明确的规则或概率计算。而深度学习系统(如大语言模型)的推理能力仍处于发展中。在解决复杂问题时,提示LLM进行逐步推理,以此克服直接提示下的错误倾向,被证明更为有效。这种推理方式的优势在应对高难度任务时尤为突出,这展现了AI在推理领域的潜力。

02解开LbT的谜题

在前文中,我们探讨了自然脑与机器脑如何通过思考进行学习,尽管它们的运作机制不同,但都面临同样的问题——

为什么“思维”本身就能促进学习?

诗人兼剧作家海因里希·冯·克莱斯特曾论述过“通过说话来学习”的益处——通过向他人表达思考,我们能够在“推理的工坊”中理清和发展自己的想法。他还提出了解释LbT悖论的“思维即学习”思路:学习的并不是我们作为个体的自我,而是我们心智中的某种特定状态。换句话说,LbT中的“学习”并非创造全新的知识,而是让已有的知识变得可获取。思维之所以能够成为学习的源泉,是因为知识的基础早已存在于心智中,只是尚未被我们清晰意识到。

从认知的角度来看,“通过推理进行学习”的过程是学习者将两个前提结合,得出一个在逻辑上已经成立但未明确认识的结论。尽管结论已蕴含在前提中,唯有通过推理过程,将结论变得显而易见,才构成了学习。在这个过程中,推理不仅是机械地组合信息,还产生了一个全新表征,这一表征独立于前提而存在。

图源:CalebBerciunas

将这一思路应用到“通过解释进行学习”时,情况变得复杂得多。因为解释过程中,学习者往往并不清楚什么是明确的“前提”,此时表征的“可及性”便显得尤为关键。不同类型的输入会影响表征的提取。例如,当我们处理“加法”时,输入的是阿拉伯数字还是罗马数字,会显著影响我们对输入特征的感知(如奇偶性),并且可以通过不同的算法(如解释、比较和模拟)来改变可及性条件,从而支持“表征提取(representationalextraction)”,创造出具有新可及性条件的全新表征。

表征提取是指通过思考或推理,形成一个特定的认知结构,这个结构具有不同的“可及性”条件。一旦表征被提取出来,它就变成某种前提,继而限制了输出的范围。

在“通过解释进行学习”中,这一点尤为明显——当学习者展开解释时,倾向于选择“根原因(rootcauses)”较少的解释,也就是说,他们更愿意认为某些因果假设比其他假设更合理、更优越。这样的选择形成了一种隐性前提,限制了后续推理的空间。例如,当学习者对某一解释产生偏好时,这种偏好本身就构成了新的前提,进而影响接下来得出的结论。

通过推理和解释的思考的行动.图源:[2]

理解“可及性”差异和表征提取的作用,能够帮助我们将推理学习的逻辑推广至其他学习形式,如解释、比较和模拟。每种形式中的认知过程,都可以看作是通过不断提取新的表征,建立新的推理前提,从而逐步推进学习的进程。但这无法解决另一个问题——

为什么要期望通过解释、模拟或其他LbT过程得出的结论能够产生新的“知识”,即真实的、符合事实的知识?

当然,LbT的输出不一定总是正确的。然而,由于这些过程可能受进化、经验或人工智能设计的影响,我们可以合理地假设,LbT至少部分反映了世界的结构,因此有可能产生相对可靠的结论[5]。即使输出不完全准确,它们仍能在引导思维和行动上发挥作用。例如,通过解释进行学习时,即使生成的解释有误,解释的过程本身可能改善后续的探究和判断,比如帮助学习者识别表征之间的冲突,或者以更抽象的方式表征某个领域。

理解了LbT的机制和潜在价值后,接下来的问题是——

为什么LbT是“必要的”?

这些观察还预示了自然思维与人工思维在LbT作用上的差异。随着人工智能逐渐克服人类思维的资源限制,或者当它们处理的问题不涉及高不确定性时(比如在非常狭窄的领域操作),我们预期在这些条件下,人工智能与人类在LbT过程中的表现将会出现显著差异。

03总结

"通过思考进行学习"(LbT)几乎无处不在:人类不仅通过观察学习,还通过解释、比较、模拟、推理等方式获取知识。近年来的研究表明,人工智能系统也能够以类似的方式进行学习。在这两类情境下,我们可以通过认识到表征的“可及性”条件会发生变化,来破解LbT的悖论。LbT使得学习者能够提取具有新可及条件的表征,并利用这些表征生成新的知识与能力。

尽管如此,关于LbT在自然智能和人工智能中的实现,还有许多未解之谜。我们尚不完全明白,这些过程如何具体地促进人类智能的发展,或者它们在何种情况下可能引导我们走向错误的方向。要揭示这些问题的答案,不仅需要深入的思考,更需要依赖跨学科的认知科学工具包的支持。

参考文献

[1]WEIJ,WANGX,SCHUURMANSD,etal.ChainofThoughtPromptingElicitsReasoninginLargeLanguageModels[J].ArXiv,2022,abs/2201.11903.

[2]Lombrozo,Tania.“Learningbythinkinginnaturalandartificialminds.”Trendsincognitivesciences,S1364-6613(24)00191-8.20Aug.2024,doi:10.1016/j.tics.2024.07.007

[3]CHIMTH,BASSOKM,LEWISMW,etal.Self-Explanations:HowStudentsStudyandUseExamplesinLearningtoSolveProblems[J].CognitiveScience,1989,13(2):145-82.

[4]ROZENBLITL,KEILF.Themisunderstoodlimitsoffolkscience:anillusionofexplanatorydepth[J].CognitiveScience,2002,26(5):521-62.

[5]TESSERA.Self-GeneratedAttitudeChange11PreparationofthischapterwaspartiallysupportedbygrantsfromtheNationalScienceFoundation(SOC74-13925)andtheNationalInstitutesofMentalHealth(1F32MH05802-01).SomeoftheworkwascompletedwhiletheauthorwasaVisitingFellowatYaleUniversity.IamindebtedtoRobertAbelsonandClaudiaCowanforreadingandcommentingonpreliminaryversionsofthischapter[M]//BERKOWITZL.AdvancesinExperimentalSocialPsychology.AcademicPress.1978:289-338.

[6]BERKEMD,WALTER-TERRILLR,JARA-ETTINGERJ,etal.FlexibleGoalsRequirethatInflexiblePerceptualSystemsProduceVeridicalRepresentations:ImplicationsforRealismasRevealedbyEvolutionarySimulations[J].CognSci,2022,46(10):e13195.

[7]GRIFFITHSTL.UnderstandingHumanIntelligencethroughHumanLimitations[J].TrendsinCognitiveSciences,2020,24(11):873-83.

THE END
1.科学哲学视角下的EPR悖论研究关于思想实验与科学悖论在科学发展中的作用。思想实验在物理学史上尤其是近代物理学史上有着很重要的地位,许多伟大的思想都是通过思想实验而发现的,因而说思想实验是促进科学理论发现的重要方式,我们称之为“思想的铲子”;而科学悖论,则可以分为由具体理论或实际实验揭示出来的悖论,以及通过思想实验而得出的悖论,科学https://wap.cnki.net/touch/web/Dissertation/Article/-2010184127.html
2.读书思想实验15接下来,我们看一看伦理学的思想实验。第一个思想实验——有一部电影叫《楚门的世界》,它所用的就是“洛克的密室”这样一个悖论。“洛克的密室”说什么呢?楚门从小就生活在那个演播室里边,他的生活被直播出去。他活得很惬意,觉得周围都很好,但他一直被直播。这道德吗? https://www.jianshu.com/p/57057a122269
3.思想实验(豆瓣)本书总结罗列了包含自然世界、心灵、伦理学、哲学的多个思想实验。如:薛定谔的猫、祖父悖论、消失的大学、中文房间、洛克的密室、电车难题、救生艇地球、少数派报告、忒修斯之船、邪恶天才等。 “思想实验”是爱因斯坦提出的,可定义为“保持绝对理智,又可以发挥想象的思维模式”,书中通过一个个极端的假设,也可以引发对https://book.douban.com/subject/33271406
4.科学网—经典物理学中的几个思想实验所谓不破不立,我们解决悖论的过程实质上就是在批判旧体系基础上建立新理论。对一个纯粹的理论物理学家而言,通过思想实验或数学演算(目前更多人采用的办法)发现固有理论存在着悖论将是再美妙不过的事情了。 另外,归谬型思想实验有可能产生另一种结果,即在构造的物理情景中运用了似是而非的分析产生了彼此矛盾结论,形成https://blog.sciencenet.cn/blog-217073-815355.html
5.思想实验(精选十篇)抛开营销手段中的噱头, 思想实验在科学史上确实起过举足轻重的作用, 爱因斯坦和哥本哈根学派在理论物理学上的很多争论都借助了思想实验, 爱因斯坦那个著名的双生子佯谬更是尽人皆知。思想实验不但以最简明、抽象的方式直指科学问题的核心, 而且大多以悖论、谜题的形式出现, 如同一场智力的较量, 让人一看之下就欲罢不https://www.360wenmi.com/f/cnkeyr7t1hcf.html
6.《信条》争鸣丨心智游戏电影能否成为电影工业新配方未来焦虑:作为思想实验的大片 心智游戏电影还喜欢多重时间安排和前后移动的时间框架,而其中最有意思的就是对未来影响现在和过去可能性的思想实验。这种思想实验在被埃尔塞瑟称为心智游戏电影之父的美国科幻小说家菲利普·K·迪克的科幻小说中就反复出现,也被大部分的心智游戏电影所继承。这种循环时间的安排表征的实际上http://wenhui.whb.cn/third/zaker/202009/15/370738.html
7.布里丹之驴简介布里丹之驴故事内容布里丹之驴启示→MAIGOO百科“布里丹之驴”是法国哲学家布里丹提出的一个著名思想实验,描述了一头驴在两堆等量饲料间犹豫不决,最终因无法做出选择而饿死的情景。这个实验深刻揭示了决策过程中的复杂性和困境,挑战了我们对自由意志的理解。它提示我们,在面对相似选项时,我们可能陷入无法抉择的境地,从而影响了我们的行动和决策。通过反思这个实验,我https://m.maigoo.com/citiao/1239145.html
8.思想实验epubpdfmobitxt电子书下载2024世界*名校里,受欢迎的课程无不以“思想实验”作为引子或主题,因为它是开拓脑力疆域的秘密武器、智力创新的有效保证。 目录 前言章 假如物质停止变化——特修斯之船 物质的变化与同一 什么是“一堆稻谷”? 秃子的头发 启明星是不是长庚星? 推理的艺术 所有的乌鸦都是鸟 说假话的部落 悖论的陷阱 整数多还是偶数多https://book.tinynews.org/books/29682032418
9.微博伽利略的日心说、羽毛跟铁球在真空中下落应该一样快也都是来自于思想实验,牛顿发现第一宇宙速度也是如此……纵观科学史,几乎所有的自然科学发展都极大地借助了思想实验,很多形成悖论,然后发现其中一种解的逻辑错误,从而确立唯一解。 爱因斯坦在16岁的时候完成了一个了不起的思想实验,叫“假如我追逐一束光”,那么追https://m.weibo.cn/status/4558273825736155
10.三体社区如何在科幻中进行思想实验? 主题:思想实验操作说明:用科幻放大欲望 本期讲的是关于欲望的主题,它是人类各种故事的基本主题之一。 这个主题看起来不是很常见大量研究和多位知名科学家都认为时间旅行是可行的,包括爱因斯坦、霍金等人,可是总避不开一个经典的悖论。 比如说,一位时间旅行者回到过去阻止一场瘟疫的爆发https://www.santiw.com/santishequ/
11.公务员考试真题答案:2014云南公务员真题答案解析(行测)伏尔泰早提出社会契约论的思想中公解析:卢梭早提出社会契约论的思想,并提出“天赋人权说”。故本题答案困惑 悖论中公解析:第一空,形容战争史家对于研究论题的感觉,“尴尬”、“沮丧”不合题意,排除A、D某重点中学新购入的实验室设备和器材中公解析:经营性资产的定义要点为:使用单位是具有法人地位的企业;https://www.51test.net/show/3887955.html