评价石灰稳定性的软件包
lime-stabilit的Python项目详细描述
石灰稳定性指标
这个项目是关于测量通过LIME工具获得的解释的稳定性。在
LIME(局部可解释模型不可知论解释)是一种非常成熟的技术,它可以理解机器学习模型的推理。
^{1{1}我们建议阅读一个更深入的理解。在
尽管LIME是一个很好的工具,但是它仍然存在稳定性差的问题,即在相同的条件下重复应用该方法可能会得到不同的结果。 更糟糕的是,很多时候,从业者根本没有发现稳定性问题,例如,当只执行一个对方法的调用,结果被认为是可以的,而不需要进一步检查。在
只有在没有歧义的情况下,解释才被认为是可靠的
在这个概念的指导下,我们发展了一对互补指标来评估石灰稳定性:变量稳定性指数(VSI)和系数稳定性指数(CSI)。在
该方法为要解释的同一数据点创建重复的石灰解释。
VSI索引检查不同的石灰是否返回相同的变量作为解释。
CSI索引控制在重复的leme调用下每个变量的系数是否可以被认为是相等的。在
每种训练石灰法都能计算出指标。它们的范围都在0到100之间,较高的值意味着测试的石灰是稳定的。它们被设计成可以一起使用,因为每一个测试一个不同的稳定性概念。在
使用这些指数将增强对石灰结果的信心:从业者可能会发现其经过训练的石灰中可能存在的不稳定性,或者他可以保证其一致性。在
为了更深入地了解这种方法,我们建议阅读论文Statistical stability indices for LIME: obtaining reliable explanations for Machine Learning models [1]。在
在
[1]Visani,Giorgio,et al.“石灰的统计稳定性指数:获得机器学习模型的可靠解释”,arXiv预印本arXiv:2001.11757(2020年)。在
安装
通过pip包管理器安装:
pip install lime-stability
先决条件
依赖项列表:
- 石灰
- statsmodels公司
- 学习
- numpy公司
要对其使用索引的数据类型
lime_stability
中的稳定性指数目前仅适用于表格数据(LimeTabularExplainer类)。虽然这些索引背后的理论也允许它们用于其他类型的数据,但是实现还不可用。在
作者
- Giorgio Visani:institutional page
认识
我们要感谢CRIF S.p.A.和{a9},他们在财政上支持了这个项目。在
- 项目
标签: