随机森林分类规则挖掘包
randomForestRules-lukassykora的Python项目详细描述
随机森林规则
获取sklearn RandomForestClassifier找到的所有规则的表示。其工作原理如下:
- 对于每个特性,它应用一个热编码,使每个列都是二进制的。在
- 随机森林运行的特征和目标属性。在
- 所有的树都是从随机森林回归器中提取出来的。在
- 决策树被分割成分类规则。在
GIT存储库
https://github.com/lukassykora/randomForestRules
安装
pip安装randomForestRules lukassykora
Jupyter笔记本
示例
fromrandomForestRulesimportRandomForestRulesimportpandasaspddf=pd.read_csv("data/audiology.csv")df.columns=df.columns.str.replace("_","-")# underscore not allowed# All feature columnscols=[]forcolindf.columns:ifcol!='binaryClass':cols.append(col)# InitializerandomForest=RandomForestRules()# Load datarandomForest.load_pandas(df)# FitrandomForest.fit(antecedent=cols,consequent='binaryClass',supp=0.005,conf=50)# Get resultframe=randomForest.get_frame()
- 项目
标签: