选择要素后打印列/变量名称

import pandas from pandas import read_csv from numpy import set_printoptions from sklearn.feature_selection import SelectKBest from sklearn.feature_selection import f_classif dataframe = pandas.read_csv("C:\\dateset\\iris.csv"])) array = dataframe.values X = array[:,0:4] Y = array[:,4] test = SelectKBest(score_func=f_classif, k=2) fit = test.fit(X, Y) set_printoptions(precision=2) arr = fit.scores_ print (arr) # [ 119.26 47.36 1179.03 959.32]

2条回答

网友

1楼 · 编辑于 2024-06-16 14:57:02

import pandas
from pandas import read_csv
from numpy import set_printoptions
from sklearn.feature_selection import SelectKBest
from sklearn.feature_selection import f_classif

dataframe = pandas.read_csv("iris.csv")
array = dataframe.values
X = array[:,0:4]
Y = array[:,4]

test = SelectKBest(score_func=f_classif, k=2)
fit = test.fit(X, Y)

set_printoptions(precision=2)
arr = fit.scores_

idx = (-arr).argsort()[:2]
print (idx)

print (arr)
#names=[dataframe.columns[j] for j in X]

names = dataframe.columns[idx]
print(names)

输出

[2 3]
[ 119.26   47.36 1179.03  959.32]
Index(['petal_length', 'petal_width'], dtype='object')

网友

2楼 · 编辑于 2024-06-16 14:57:02

使用索引，这里可以使用列名称，因为选择了前4列：

#first 4 columns
X = array[:,0:4]

cols = dataframe.columns[idx]

如果对X的选择不同，则还需要使用变量按位置数据帧进行筛选：

#e.g. selected 3. to 7. column
X = array[:,2:6]

cols = dataframe.iloc[:, 2:6].columns[idx]

相关问题更多 >

编程相关推荐

热门问题

热门文章