机器学习模型的“可解释性”到底有多重要？腾讯云开发者社区|法律的重要性的例子_法律

为什么机器学习中的可解释性很重要？

在自下而上的数据科学方法中，我们将部分业务流程委托给机器学习模型。此外，全新的商业创意可通过机器学习实现。自下而上的数据科学通常将手动和部分困难任务自动化。例如制造公司可以将传感器放在他们的机器上并进行预测维护。因此，维护工程师可以更高效地工作，而无需执行昂贵的定期检查。模型可解释性对于验证模型的行为是否符合您的期望是很有必要的，并且它可以与用户建立信任关系，并且可以简化从手动过程到自动化过程的过渡。

图显示在一个自上而下的过程中，您迭代地构造和验证一组假设。在自底向上的方法中，您试图自动化过程从自底向上解决问题。

为什么深入分析模型至关重要？

1.判别并减轻偏差（Identifyandmitigatebias）：

偏差可能存在于任何数据集中，数据科学家需要确定并尝试修正偏差。数据集的规模可能有限，并且不能代表所有数据，或者数据捕获过程可能没有考虑到潜在的偏差。在彻底进行数据分析后，或者分析模型预测与模型输入之间的关系时，偏差往往会变得明显。请注意，解决偏差问题没有唯一的解决方案，但是可解释性的关键一步是意识到潜在的偏差。

其他偏差的例子如下：

例如当您在小型数据集上训练目标检测模型时，通常情况下图像的宽度太有限。为了避免只适用于数据中噪音和不重要元素的模型，需要在不同环境，不同光照条件和不同角度下的各种物体图像。

2.考虑问题的上下文（Accountingforthecontextoftheproblem）：

在大多数问题中，您正在使用的数据集仅仅是您正试图解决的问题的粗略表示，而机器学习模型无法捕捉到真实任务的完整复杂性。可解释模型可帮助您了解并解释模型中包含和未包含的因素，并根据模型预测采取行动时考虑问题的上下文情境。

3.改进泛化能力和性能（Improvinggeneralisationandperformance）：

高解释性模型通常有更好的泛化能力。可解释性不是要了解所有数据点的模型的每个细节。必须将可靠的数据，模型和问题理解结合起来才能获得性能更好的解决方案。

4.道德和法律原因（Ethicalandlegalreasons）：

在财务和医疗保健这样的行业，审计决策过程并确保它是没有歧视或违反任何法律。随着数据和隐私保护法规（如GDPR）的发展，可解释性变得更加重要。此外，在医疗应用或自动驾驶汽车中，单一不正确的预测会产生重大影响，能够“验证”模型至关重要。因此，系统应该能够解释它是如何达到给定的要求的。

解释你的模型

关于模型可解释性的通常引用是，随着模型复杂性的增加，模型可解释性按照同样的速度降低。特征重要性是解释模型的一种基本方法。即使对于深度学习等黑盒模型，也存在提高可解释性的技术。最后，将讨论LIME框架，该框架可作为模型分析的工具箱。

特征重要性（Featureimportance）

广义线性模型

例如在构建文本分类器时，可以绘制最重要的特征，并验证模型是否过拟合。如果最重要的单词不符合您的直觉（例如名称或停用词），则意味着该模型拟合了数据集中的噪音，将在新数据中表现不佳。

从TidyTextMining的文本解释能力的一个可视化的示例。

·随机森林和SVM（RandomforestandSVM’s）

即使是非线性模型（如基于树的模型（例如随机森林））也能够获取关于特征重要性的信息。基于核的方法（如SVM）中的权重通常不是特征重要性的很好的代表。核方法的优点在于，通过将特征投影到内核空间中，您可以捕获变量之间的非线性关系。另一方面，仅将权重视为一个特征，与交互无关。

·深度学习（Deeplearning）

可解释机器学习的研究论文的数量正在迅速增长(MIT)。

特别是在面向更复杂地文本和图像处理的系统时，很难解释模型实际学到的是什么。研究的主要焦点目前主要是将输出或预测与输入数据关联。虽然在线性模型下这相当容易，但对于深度学习网络来说，它仍然是一个未解决的问题。两种主要方法是基于梯度或基于注意力机制的。

在基于梯度的方法中，使用反向传播计算目标概念的梯度用于生成一个映射，以突出显示输入中用于预测目标概念的重要区域。这通常应用于计算机视觉领域。

Grad-CAM,一个基于梯度的方法被使用于视觉描述生成。基于输出的文字，方法能够判别出输入图像的那个区域是重要的

在基于注意力机制的自动问答中，可以可视化出文本中哪个单词对于这个问题的答案是最最重要的。

LIME是一个更通用的框架，旨在使“任何”机器学习模型的预测更加可解释。

为了保持模型独立性，LIME通过修改本地模型的输入来工作。因此，它不是试图同时理解整个模型，而是修改特定的输入实例，并监控对预测的影响。在文本分类的情况下，这意味着一些词被取代，以确定哪些元素的输入影响了预测。

THE END

机器学习模型的“可解释性”到底有多重要？腾讯云开发者社区

学好用好民法典做知法守法好公民法治

增强法律意识的重要性范例6篇

法律伦理案例(精选5篇)

道德与法治教育案例范文

机器学习模型的“可解释性”到底有多重要？腾讯云开发者社区

法制教育案例心得体会范文（通用19篇）

法律逻辑学论文汇总十篇

法律人如何思与行——法学教育中法学方法作用的影响读书笔记

法律思维通用12篇

建筑法规在建筑工程中的重要性是什么

民事法律行为的例子精品(七篇)

道德和法律辩论样例十一篇

提高法治思维能力优选九篇

陈坤：法律解释与法律续造的区分标准

法律小故事范文（共20篇）

中外法学新刊

民法学方法论两大核心：请求权基础与法律关系分析法王利明

关于法律作文800字（精选37篇）