我正在Iris dateset上尝试功能选择
我指的是Feature Selection with Univariate Statistical Tests
我正在使用下面的行,我想找出重要的功能:
import pandas
from pandas import read_csv
from numpy import set_printoptions
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_classif
dataframe = pandas.read_csv("C:\\dateset\\iris.csv"]))
array = dataframe.values
X = array[:,0:4]
Y = array[:,4]
test = SelectKBest(score_func=f_classif, k=2)
fit = test.fit(X, Y)
set_printoptions(precision=2)
arr = fit.scores_
print (arr)
# [ 119.26 47.36 1179.03 959.32]
为了通过得分显示前2名的索引,我添加了:
idx = (-arr).argsort()[:2]
print (idx)
# [2 3]
此外,如何获得列/变量名(而不是它们的索引)
输出
使用索引,这里可以使用列名称,因为选择了前4列:
如果对
X
的选择不同,则还需要使用变量按位置数据帧进行筛选:相关问题 更多 >
编程相关推荐