机器学习模型的“可解释性”到底有多重要?腾讯云开发者社区

为什么机器学习中的可解释性很重要?

在自下而上的数据科学方法中,我们将部分业务流程委托给机器学习模型。此外,全新的商业创意可通过机器学习实现。自下而上的数据科学通常将手动和部分困难任务自动化。例如制造公司可以将传感器放在他们的机器上并进行预测维护。因此,维护工程师可以更高效地工作,而无需执行昂贵的定期检查。模型可解释性对于验证模型的行为是否符合您的期望是很有必要的,并且它可以与用户建立信任关系,并且可以简化从手动过程到自动化过程的过渡。

图显示在一个自上而下的过程中,您迭代地构造和验证一组假设。在自底向上的方法中,您试图自动化过程从自底向上解决问题。

为什么深入分析模型至关重要?

1.判别并减轻偏差(Identifyandmitigatebias):

偏差可能存在于任何数据集中,数据科学家需要确定并尝试修正偏差。数据集的规模可能有限,并且不能代表所有数据,或者数据捕获过程可能没有考虑到潜在的偏差。在彻底进行数据分析后,或者分析模型预测与模型输入之间的关系时,偏差往往会变得明显。请注意,解决偏差问题没有唯一的解决方案,但是可解释性的关键一步是意识到潜在的偏差。

其他偏差的例子如下:

例如当您在小型数据集上训练目标检测模型时,通常情况下图像的宽度太有限。为了避免只适用于数据中噪音和不重要元素的模型,需要在不同环境,不同光照条件和不同角度下的各种物体图像。

2.考虑问题的上下文(Accountingforthecontextoftheproblem):

在大多数问题中,您正在使用的数据集仅仅是您正试图解决的问题的粗略表示,而机器学习模型无法捕捉到真实任务的完整复杂性。可解释模型可帮助您了解并解释模型中包含和未包含的因素,并根据模型预测采取行动时考虑问题的上下文情境。

3.改进泛化能力和性能(Improvinggeneralisationandperformance):

高解释性模型通常有更好的泛化能力。可解释性不是要了解所有数据点的模型的每个细节。必须将可靠的数据,模型和问题理解结合起来才能获得性能更好的解决方案。

4.道德和法律原因(Ethicalandlegalreasons):

在财务和医疗保健这样的行业,审计决策过程并确保它是没有歧视或违反任何法律。随着数据和隐私保护法规(如GDPR)的发展,可解释性变得更加重要。此外,在医疗应用或自动驾驶汽车中,单一不正确的预测会产生重大影响,能够“验证”模型至关重要。因此,系统应该能够解释它是如何达到给定的要求的。

解释你的模型

关于模型可解释性的通常引用是,随着模型复杂性的增加,模型可解释性按照同样的速度降低。特征重要性是解释模型的一种基本方法。即使对于深度学习等黑盒模型,也存在提高可解释性的技术。最后,将讨论LIME框架,该框架可作为模型分析的工具箱。

特征重要性(Featureimportance)

广义线性模型

例如在构建文本分类器时,可以绘制最重要的特征,并验证模型是否过拟合。如果最重要的单词不符合您的直觉(例如名称或停用词),则意味着该模型拟合了数据集中的噪音,将在新数据中表现不佳。

从TidyTextMining的文本解释能力的一个可视化的示例。

·随机森林和SVM(RandomforestandSVM’s)

即使是非线性模型(如基于树的模型(例如随机森林))也能够获取关于特征重要性的信息。基于核的方法(如SVM)中的权重通常不是特征重要性的很好的代表。核方法的优点在于,通过将特征投影到内核空间中,您可以捕获变量之间的非线性关系。另一方面,仅将权重视为一个特征,与交互无关。

·深度学习(Deeplearning)

可解释机器学习的研究论文的数量正在迅速增长(MIT)。

特别是在面向更复杂地文本和图像处理的系统时,很难解释模型实际学到的是什么。研究的主要焦点目前主要是将输出或预测与输入数据关联。虽然在线性模型下这相当容易,但对于深度学习网络来说,它仍然是一个未解决的问题。两种主要方法是基于梯度或基于注意力机制的。

在基于梯度的方法中,使用反向传播计算目标概念的梯度用于生成一个映射,以突出显示输入中用于预测目标概念的重要区域。这通常应用于计算机视觉领域。

Grad-CAM,一个基于梯度的方法被使用于视觉描述生成。基于输出的文字,方法能够判别出输入图像的那个区域是重要的

在基于注意力机制的自动问答中,可以可视化出文本中哪个单词对于这个问题的答案是最最重要的。

LIME是一个更通用的框架,旨在使“任何”机器学习模型的预测更加可解释。

为了保持模型独立性,LIME通过修改本地模型的输入来工作。因此,它不是试图同时理解整个模型,而是修改特定的输入实例,并监控对预测的影响。在文本分类的情况下,这意味着一些词被取代,以确定哪些元素的输入影响了预测。

THE END
1.探索正义的边界法律学术之旅我想学法律,这个决定如同一座桥梁,连接着知识的海洋与未来的无限可能。法律,不仅是规则和规范的集合,更是一种维护社会秩序、保障公平正义的手段。我希望通过学习法律,能够深入理解这个世界如何运作,以及我们每个人在其中扮演什么角色。 二、解锁法律之门 要想学好法律,我们首先需要了解它的基础知识。这包括宪法、民法典https://www.cjan6a6c.cn/ke-yan-cheng-guo/455247.html
2.法律比道德更重要实例篇7:法律比道德更重要实例 ·新闻道德:是在新闻传播活动中,为调整人际及个人与社会之间的关系,提倡和遵循的行为规范。 ·新闻价值:是选择和衡量新闻事实的客观标准,即事实本身所具有的构成新闻的特殊素质之和。包括时效性、重要性、显著性、接近性以及趣味性几个基本属性。《新闻学辞典》 https://www.360wenmi.com/f/file5j2p72ds.html
3.法律促进社会和谐的例子5篇法律促进社会和谐的例子5篇法律促进社会和谐的例子 物权法:社会和谐的重要法律基石 十届全国人大五次会议审议通过的物权法,符合我国宪法,全面准确地体现和坚持了社会主义基本经济制度,反下面是小编为大家整理的法律促进社会和谐的例子5篇,供大家参考。 篇一:法律促进社会和谐的例子 https://www.maxzhishu.com/zhuantifanwen/gongwenfanwen/23235.html
4.浅谈建筑工程资料管理工作的重要性所以预结算人员与现场资料员相结合对施工过程资料进行严格按照相关规范要求严格把控,此项工作对于开展后期结算工作顺利进行的必要性。这就可以看出建筑工程资料管理对于建筑工程预结算工作来说有着至关重要的作用。 4、建筑工程资料管理工作对法律方面的重要性https://www.jianshu.com/p/cd57830d6f31
5.英国合约法(1)§6 弃权和禁止翻供的法律特征6. 1 暂止性 (suspensive nature) 6. 1. 1 合理通知后才能恢复权力例子之一:买方不开信用证6. 1. 2 合理通知后才能恢复权力例子之二:航运租船6. 1. 3 判断何时发出合理通知的重要性6. 1. 4 合理通知何谓“合理”? 6. 1. 5 永久性,不能以合理通知恢复权力的例外6. https://www.360doc.cn/document/4927026_1060963329.html
6.Reflector:全面的.NET反编译工具与插件系统功能完整性:包括但不限于反编译精度、调试能力、插件系统等。 社区支持:活跃的社区能提供持续的支持和更新。 理解这些基本概念,将有助于读者在面对不同需求时做出正确的选择。 2. 深入解析代码反编译技术 在当今IT技术日新月异的时代,软件的反编译变得越来越普遍和重要。这不仅仅是因为它在安全研究、逆向工程或软https://blog.csdn.net/weixin_36238982/article/details/141907832
7.霍姆斯:法律的道路我能够想到的与法律规定的相联系的不利后果是两项多少不是那么重要的法律原则,这两项原则都可以废除而不致引起什么混乱。这两项原则是:1、违反法律强制性规定的契约无效;2、如果共同侵权人中的一个赔偿了所有的损失,他不能从其他侵权人那里得到补偿。这是我所能够想出的例子。如果我们用酸剂来洗涤义务的概念并且https://www.douban.com/group/topic/3368924/