摘要:新一代人工智能以大数据和机器学习技术为核心,实行的是联结主义的路径。该路径在场景相对封闭的数据密集型应用中取得了巨大成功,但面临可解释性差、伦理对齐困难、认知推理能力弱等瓶颈问题。为了在一定程度上解决这些问题,不可避免地涉及对开放、动态、真实环境中信息的刻画,以及对人类推理和解释机制的建模。形式论辩可以提供不一致情境下知识表示与推理的通用机制,与偏好、权重、概率等决策因素的灵活结合机制,局部化和模块化的语义高效计算机制,以及基于论证和对话的可解释机制等。有机结合形式论辩与现有大数据和机器学习技术,有望在一定程度上突破现有技术瓶颈,促进新一代人工智能的健康发展。
关键词:新一代人工智能;认知推理;伦理对齐;可解释性;形式论辩
作者廖备水,浙江大学哲学学院教授(杭州310058)。
一、新一代人工智能的瓶颈问题及其所涉及知识的特点
(一)可解释性问题及其所涉及知识的特点
(二)伦理对齐问题及其所涉及知识的特点
第一,不同的规范之间可能存在冲突。这些冲突可能发生于同一伦理体系内不同伦理原则之间,或者不同伦理体系的不同伦理规范之间。在多智能体场合,冲突可能存在于个体智能体内部,或者不同智能体之间。由于冲突的存在,智能体需要依据特定的评价标准(如道德上的、利益上的、审美上的)做出选择。
(三)认知推理问题及其所涉及知识的特点
新一代人工智能以大数据和机器学习为核心,但当前作为机器学习典型方法的深度学习只能做到“感觉”(sensation),达不到“感知”(perception),更缺少认知推理的能力。为了完成复杂的任务,人工智能系统除了感知和行动之外,还需要理解、推理、自主决策等能力以解决复杂场景的困难问题。
因此,为了实现认知推理,智能系统需要具备获取知识、表达知识、更新知识和对知识进行推理的有效途径。知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。现有的机器学习方法从大数据中发现和构造知识图谱,积累了大量的知识。然而,在由机器自动建构的知识图谱中,往往存在不完备的、不确定的、甚至冲突的信息和关系。此外,知识图谱中的知识还具有动态性,即新知识可以随时加入或删除,且新知识可能与已有的知识发生矛盾。这些都是认知推理问题所涉及的知识的特点。
二、传统逻辑学理论面临的挑战
前述新一代人工智能发展所面临的三个瓶颈问题及其所涉及知识尽管在种类上有所区别,但都具有不完备性、不确定性、不一致性等特点。同时,这些知识都来自开放、动态、真实的环境。作为计算机科学的数学基础的经典逻辑(数理逻辑)无法表示和处理这类知识,而传统非单调逻辑虽然在理论上克服了该问题,但在普遍适用性、可计算性、动态性和易解释性方面存在重要挑战。
(一)知识的不完备性、不确定性和不一致性:对经典逻辑的挑战
此外,当人们运用不完备或冲突的信息进行推理时,一个结论可以依据局部信息推出,但从全局看,可能存在与其前提、结论或推理关系相矛盾的信息。这样,一个结论是否可以被推出,取决于是否存在与支持它的论证相矛盾的信息。当主体只能依据局部信息进行推理时,得到的结论可能是暂时的。当新的(矛盾)信息出现时,原有的结论可能被推翻。例如,当价值“保护病人健康”排在价值“保护病人自主权”之前时,依据Γ和由价值排序决定的规范之间的偏好关系会得到结论r。现在,假设存在另外一条规范“当病人正在处理紧急事件时,(为了保护病人的安全)不应该给他服药”和一个命题“病人正在处理紧急事件”。如果价值“保护病人安全”排序最高,则结论r将被推翻,而结论成立。这样的非单调性在经典逻辑的推出关系中不成立。反之,经典逻辑具有单调性,即如果由一组前提集合Γ可以推出结论φ,则对于任意包含Γ的前提集合Γ′,后者也能推出φ。
(二)普遍适用性、可计算性、动态性和易解释性:对传统非单调逻辑的挑战
上述非单调逻辑系统尽管满足了例外可表达和推理非单调这两个重要特性,但仍然存在不少问题,不能直接用于解决新一代人工智能的瓶颈问题。
第一,在冲突处理方面,传统非单调逻辑系统适合于表达由例外引起的冲突,但难以表达实践推理和多主体交互中的各种冲突,从而通用性较低。在实践推理中,规范之间的冲突可能来自主体的不相容的决策或行动选项,而不一定是例外,如上述规范r1—r3。在多主体交互的推理中,主体通过交换论证、比较论证和评估论证来实现说理的目的。这种基于论证的推理模式难以在传统非单调逻辑中得到直接表达。
第三,对于非单调的推理系统,新信息的加入可能引起已有推理结果的变化。在系统计算复杂性很高的情况下,如果在新信息加入后需要重新计算所有的推理结果,不仅低效,而且在许多情况下也是不可行的。为了解决该问题,一种自然的解决思路是对系统的动态性进行局部化处理。然而,在传统非单调逻辑系统中,难以区分局部推理和全局推理,给动态性的局部化处理带来了根本性的困难。例如,在缺省逻辑中,命题的一个证明是由若干缺省规则组成的有穷序列。缺省规则由三部分组成:先决条件、缺省条件和结论。对于序列中的每条推理规则,需要检查其先决条件是可证的,而缺省条件的反面是不可证的(即该规则的实施不会引起不一致性)。由于证明的过程伴随着一致性检查,每条规则的可应用性(局部推理)和整个证明是否成功(全局推理)是结合在一起的。因此,当信息发生变化时,通过重新检查所有证明或构造新证明来刻画系统的动态性,显然是低效而困难的。
三、基于形式论辩的研究路径
上一节的分析表明,在新一代人工智能背景下,为了实现对不完备、不一致信息的表示和推理,并解决可计算性、动态性和易解释性等方面的问题,不仅在逻辑基础理论方面要求有新的方法,而且在计算高效性和人机交互有效性方面也需要有新的机制。
在探究这些新方法和新机制的过程中,一种自然的思路是回归到人类的常用推理和说理模式。众所周知,人类的推理和说理经常以交换论证的形式进行。直觉上,一个内部自洽的论证是可接受的,当且仅当与之有冲突的其他论证均被拒绝。通过这种方法,一致性仅限于论证内部,而不同的论证之间可以有冲突。当新的论证出现时,与之存在冲突关系的其他论证的状态可能发生变化。换句话说,这种基于论证和论证之间交互的方法不仅可以表达不完备的、不一致的知识,而且可以实现非单调推理。沿着这个思路,自然产生如下问题:这种以交换论证的形式进行的推理是否具有严格的数学模型?如果存在这样的模型,它与传统非单调逻辑有何关系?
鉴于上述原因,基于形式论辩的方法在解决新一代人工智能瓶颈问题方面有望发挥重要作用。接下来从五个方面对基于形式论辩的研究路径作介绍和分析。
(一)形式论辩理论
论辩是人类智能的重要方面,人们经常通过论辩来进行日常推理、科学决策、澄清观点等。在许多情况下,一个观点是否可以被采纳,不是完全取决于该观点的真假,而是取决于与支持该观点的论证有反对关系的其他论证的状态。人类推理经常以交换论证的形式展开,且推理过程经常受语用因素的影响。为了刻画人类这种论辩机制的本质,使得该机制可以被应用于计算机科学领域,抽象论辩理论应运而生。该理论刻画了人类论辩的重要原则:“笑到最后的才是最好的”。基于该思路,潘明勇提出了抽象论辩框架的概念,并通过它来定义论证的可接受性。下面以一个例子来引入这一概念。
给定一个抽象论辩框架,可以通过建立具有一般意义的评价标准来定义论证集合的可接受性。通常把这样的评价标准称为论辩语义,而把每个可接受的论证集合称为该语义下的一个外延。与人类的推理直觉相对应,最基本的语义(称为可相容语义)必须满足无冲突性和可防御性。形式化地,我们说一个论证集合是无冲突的当且仅当E中的任何论证之间都不存在攻击关系,E可防御论证α∈A当且仅当对于每个攻击α的论证β,在E中都存在一个攻击β的论证。因此,无冲突性确保推理结果的协调性,而可防御性则反映了人类论辩机制的上述重要原则“笑到最后的才是最好的”。满足这两个条件的外延也称为可相容外延。在此基础上,通过添加其他条件,可得到其他语义下的外延。例如,若一个可相容外延包含它可防御的所有论证,那么它是一个完全外延;把一个极大的完全外延称为优先外延;把一个极小的完全外延称为基外延。上述例子所对应的抽象论辩框架(记作F1)如下图所示。它有两个优先外延E1={α,δ}和E2={β,δ},一个基外延E3={δ}。
(二)不一致情境下知识表示与推理的通用机制
以抽象论辩为基础的形式论辩理论刻画了人类推理的一般机制,使其具有良好的通用性。形式论辩不仅可以刻画传统非单调逻辑,而且可以用于建模其他各种不一致情境中的推理。
在不完备知识的表达方面,基于形式论辩的方法与传统非单调逻辑方法不同。基于形式论辩的方法既不是通过给经典一阶逻辑的模型集合或可能世界集合添加限制条件,也不是在推理规则中增加“失败即否定”条件,而是通过添加新论证以攻击已有论证来实现的。例如,对于上述论证δ“一般情况下,电池显示正常”。在不存在其他论证时,论证δ自然成立。当有新的信息出现时,不需改变原来的论证,而只需增加新论证和攻击关系。例如,当出现新论证η“观察信息o3显示,此次电池显示存在异常”。这样,η击败δ,并得到一个新的抽象论辩框架(记作)。由此可见,通过增加论证和攻击关系的形式来刻画例外,更加灵活。它避免了重新构建论证或证明的过程,只要通过有向图中节点的添加,就可实现例外的表达。由于在一个抽象论辩框架中,论证的状态取决于与其具有攻击关系的其他论证的状态,因此关于论证状态的推理是非单调的。在前面的例子中,当论证δ没有攻击者时,δ是可接受的;当增加了攻击δ的论证η后,论证δ是被拒绝的,因此其结论也被拒绝而撤回。
在上述例子中,除了认识推理,还有规范推理。规范之间的冲突也可以表示为相应论证之间的攻击关系。这样,因果推理、知识图谱推理、规范推理等在形式论辩中均可以得到统一表达。
此外,在形式论辩理论中,区分局部推理和全局推理。前者局限于个体论证内部,因此可以采用不同的推理形式,如演绎推理、基于可废止规则的推理、基于论证图式的推理等,也可以是不同的推理种类,如认识推理、规范推理、因果推理等。这样,不同种类的论证可以被放在一个抽象论辩框架中评估。这种推理模式充分反映了人类推理和说理中可以包含各种推理类型的特点。
(三)与偏好、概率等决策因素的灵活结合机制
值得注意的是,形式论辩理论提供了表示和处理偏好或权重的方便机制。对于偏好,其基本原理是通过把组成论证的各部分的优先级提升到论证之间的优先级,即把个体之间的优先级提升到由个体组成的集合之间的优先级。为了达到该目的,通常采用民主原则或精英原则。给定集合X和Y,依据民主原则,说X优先于Y,当且仅当对于Y中的任意个体y,在X中都存在一个x,使得x优先于y;依据精英原则,说X优先于Y,当且仅当在Y中存在个体y,使得对于X中的任何个体x,都有x优先于y。尽管这两种原则不是普遍适用的,但在特定情况下有着较好的可应用性。
形式论辩理论还提供了表示和处理概率的机制。以上述例子为例,当运用观察信息进行推理时,由机器学习方法得到的信息存在不确定性。假定观察信息o2和o3的概率分别是p(o2)和p(o3)。于是,论证β有p(o2)的概率存在,论证η有p(o3的概率存在(即出现于论辩框架中)。当考虑论证的存在概率时,论证的可接受性也具有概率。这样,通过把概率理论和论辩理论结合起来,可以对既不一致又不确定信息进行表示和推理。值得注意的是,在许多情况下,信息的不一致性和不确定性无法单纯由概率理论或论辩理论来表达,而需要二者的结合。在图1的例子中,我们可以用论证之间的攻击关系来表示规范之间的冲突,而用论证的存在概率来表示观察信息的不确定性。
(四)基于局部化和模块化思想的高效语义计算机制
符号主义人工智能的瓶颈问题之一是计算复杂性问题。在引入非单调推理机制之后,相应算法的计算复杂性进一步提高了。因此,如何有效提高非单调推理系统的计算效率,降低计算复杂性,是逻辑学与人工智能交叉研究的重要问题。抽象论辩理论具有基于模块化和局部化思想的高效计算机制。
抽象论辩理论处理动态信息时同样具有高效的计算机制。论辩框架中动态性在多数情况下是局部的,不会波及整个论辩框架。于是,可以利用有向图中节点之间的可达关系,识别受影响的论证集合和不受影响的论证集合。这样,在多数语义下,只有受影响的论证集合需要被重新评估,因此可以达到局部处理系统动态性的目的。例如,添加论证θ“观察信息o2不可靠”。该论证攻击论证β。把θ加入后,得到。依据攻击关系,从θ出发,只有α和β是可达的。因此,可以把分解为受影响的部分和不受影响的部分。在多数论辩语义下,对于不受影响的部分,其外延保持不变;对于受影响的部分,其外延可以在一个受限的子框架中求解。
(五)基于论证的可解释机制
此外,从解释的机制看,可以采取不同的方式,如基于论证的对话机制、基于论证树的解释、基于子框架的解释等。
结论与展望
新一代人工智能的瓶颈问题给逻辑学的发展提出了新的挑战和机遇。该挑战的核心是要求基于逻辑的系统必须能够处理来自开放、动态、真实环境中的不完备、不确定和不一致的信息,同时在可计算性、动态性和可解释性方面具有良好性能。传统非单调逻辑克服了经典逻辑的缺陷,能够表示不完备信息并进行非单调推理,但在通用性、可计算性、动态性和易解释性等方面存在不足。形式论辩作为一种关于冲突的演算,通过分层抽象的方式来刻画人类推理与说理方式,不仅可以等价表达多种传统非单调逻辑,而且为建模各种不一致情境中的推理提供了更加通用的模型。同时,在抽象论辩层次上,通过利用图论中节点可达关系和强连通分量等概念,建立分而治之的方法,可以在很大程度上提高系统语义的计算效率和系统动态性的处理效率。此外,基于论证的解释机制为提高人工智能系统的易解释性提供了一个重要途径。
此外,由上述分析可知,逻辑学基础理论的革新有利于促进新一代人工智能所面临瓶颈问题的解决。然而,如同人类的认知必须和感知相结合才能实现智能那样,人工智能的发展也离不开感知方法和认知方法的结合。因此,如何把基于逻辑的方法与机器学习方法相结合是一个需要进一步解决的挑战性问题。一方面,机器学习方法一般由数据驱动,主要采用概率和统计方法,反映的是某些特性的量的规定性。相反,有关概念和特性的逻辑表征体现的是事物的性质或关系。从认知科学的角度看,机器学习方法重在感知方面,而符号方法重在认知方面。人工智能不同研究范式的融合根植于它们所模拟的认知类型的可融合性。因此,需要把二者紧密联系起来。从方法的层面看,二者的结合路径可以多样化。
第一,在认知推理方面,基于知识图谱的认知推理是一个可行性较高的路径。一方面,人类的各种知识可以在知识图谱中得到恰当表达。尽管知识图谱中的知识可能是不完备的或存在冲突,但基于传统非单调逻辑或形式论辩的方法可以有效处理这类知识。另一方面,知识图谱的生成和演化可以基于机器学习方法。通过分类和聚类,新的知识不断被加入知识图谱或对知识图谱进行更新。这样,对于需要认知推理的时候,就可以利用基于知识图谱的推理来弥补数据驱动的机器学习方法在推理决策方面的不足。此外,在处理计算复杂性和系统动态性方面,基于形式论辩的方法提供了模块化和局部化的计算支持,可以在一定程度上提高系统的计算效率。
第二,在伦理对齐方面,事件分类、事实认定、价值原则获取、因果关系识别等可以运用机器学习方法,但社会规范和文化规范的表达、不同主体的价值及其排序的表征以及基于这些形式化知识的推理等,则只能采取符号方法。目前,国内外学者已通过各种方法来把机器学习与基于规则的知识表示结合起来,以实现伦理对齐。例如,结合量化论辩树和机器学习的方法用论辩树来表达网络诈骗案件的规范知识,用数据驱动的机器学习方法来获取论辩树中节点的初始值以及边的权重,以此来优化决策,克服法律规范难以在机器学习中得到明确表达的缺点;利用归纳逻辑编程来实现基于案例的学习,把伦理原则与公众意见结合起来,以指导公共政策。