基于分类特征的特征选择

1条回答

网友

1楼 · 发布于 2024-06-16 17:30:15

下面是一个函数，它实现了一种基于树的特征重要性分析方法。它将实际返回原始数据帧，其中按重要性顺序只包含前n个特性

from sklearn.ensemble import ExtraTreesClassifier

def select_best_Tree_features(df,target_var,top_n):
"""
:param df: pandas dataframe
:param target_var: string containing the target value column name 
:param top_n: integer indicating the number of columns to consider
:return:
"""
Y = df[target_var]
X = df.drop([target_var], axis=1)
model = ExtraTreesClassifier()
model.fit(X, Y)
f = pd.Series(model.feature_importances_, index=X.columns)
f.nlargest(top_n).plot(kind='barh')
plt.show()
print('\nFeatures Scores\n',f.sort_values(ascending=False))
top_list=f.nlargest(top_n).index.tolist()
X_fi = df[top_list]
return X_fi,Y,top_list

确保dataframe的每一列都包含数值，或使用标签编码器对其进行转换

编程相关推荐

使用php web服务在签名的amazon s3 url上进行java多部分上载
mysql java hibernate如何将日期列映射为datetime？
安卓 java。错误java。util。ArrayList$ArrayListator。下一个
使用Selenium驱动程序调用chrome浏览器时出现java问题
Java中最快的数据结构（4D可视化处理）
jakarta ee将一个ArrayList对象拆分为大小相等的块，比如Java中的1MB
多线程Java使对象在按住按钮的同时移动
jackson databind如何将java注释的属性和值输出为JSON格式？
soap如何使用KSOAP在Java中序列化字符串数组中的xmlobject？
java缓存依赖项不适用于更高版本的Tomcat 9.0.37，同样适用于9.0.20

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于分类特征的特征选择

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >