最近,高度成功但不透明的机器学习模型激增,这引发了对可解释性的迫切需求。该毕业论文通过新颖的定义、方法和科学综述解决了可解释性问题,确保可解释性在现实问题的背景下是有用的。我们首先定义什么是可解释性,以及围绕它的一些需求,强调语境的作用被低估。然后,我们深入研究解释/改进神经网络模型的新方法,专注于如何最好地评分、使用和提取交互。接下来,我们将从神经网络转向相对简单的基于规则的模型,研究如何在维护极其简洁的模型的同时提高预测性能。最后,我们总结了促进可解释数据科学的开源软件和数据的工作。在每个案例中,我们深入到一个特定的背景,这激发了所提出的方法论,从宇宙学到细胞生物学到医学。所有代码都可以在github.com/csinva上找到。
本论文工作
机器学习模型最近因其准确预测各种复杂现象的能力而受到相当大的关注。然而,人们越来越认识到,除了预测之外,这些模型还能够产生关于数据中包含的领域关系的有用信息(即解释)。更准确地说,可解释机器学习可以定义为“从机器学习模型中提取有关数据中包含的关系或该模型学习到的关系的相关知识”[186](参见下一节对此的更深入的讨论)。解释有其自身的用途,如医学[153]、科学[13,278]和决策[37],以及审计预测本身,以应对监管压力[97]和公平[74]等问题。在这些领域中,解释已被证明有助于评估学习模型,提供修复模型的信息(如果需要),并与领域专家[47]建立信任。然而,随着可解释技术的爆炸式增长[186,193,291,273,90,11,300,100],可解释方法在实践中的使用引起了相当大的关注[4]。此外,我们还不清楚如何在现实环境中评估可解释技术,以促进我们对特定问题的理解。
概述数据科学生命周期的不同阶段,其中可解释性很重要。
第二部分: 利用解释改进神经网络
第三部分: 基于规则的可解释建模
本节将完全脱离深度学习,而将重点放在基于规则的建模上。只要有可能,首先拟合一个简单的模型比拟合一个复杂的模型,然后用事后的解释来检查它更可取。一个足够简单的基于规则的模型可以被完全理解,并且很容易用手模拟、记忆和推理反事实。
第四部分:开源软件与数据
在数据科学和机器学习领域,好的开源软件和数据存储库与好的想法一样有用(如果不是更有用的话)。这一部分涵盖了上述研究中产生的两个python包,以及一个为开源建模而策划的数据存储库。
专知便捷查看
便捷下载,请关注专知人工智能公众号(点击上方蓝色专知关注) 后台回复“RLML” 就可以获取《到底什么是有用的ML可解释性?伯克利郁彬高徒Singh68页博士论文《现实世界的机器学习中有用的可解释性》全面综述可解释性技术》专知下载链接 ”,了解使用专知,查看获取70000+AI主题知识资料
还没有评论,来说两句吧...