如何将随机林中选定的特征转换为新的lis

[ True True True True True True True True True True True True True True True False True True False True True True False True True True True True True True True False True False False True True False False False False False False False False False False True False False True False False False False False False True False False False True False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False False True False False True False False False True False True False False False False False False False False False False False False False False False False False False False False False True False False False False False False False False True False False False False False False True False False False True True False False False False False False False False False False False False False False False False False False False True False False False False False False False True False False True False True False True False False True False False False False False False False False False False False False False False True False True False True False False False False False False False False False True True False False False False False False False False False True False True True False True False False False False False True True True False False False False False False False False False False False False False False False False False False False False False False False False True False False False False False False False False False False False False False True False False False False True False]

[True, True, True, True, True, True, True, True, True, True, True, True, True, True, True, False, True, True, False, True, True, True, False, True, True, True, True, True, True, True, True, False, True, False, False, True, True, False, False, False, False, False, False, False, False, False, False, True, False, False, True, False, False, False, False, False, False, True, False, False, False, True, False, False, False, False, False, False, False, False, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, False, True, False, False, False, True, False, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, False, False, False, False, False, False, False, False, False, True, False, False, False, False, True, False, False, False, True, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, False, False, False, False, False, False, True, False, False, True, False, True, False, True, False, False, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, True, False, True, False, False, False, False, False, False, False, False, False, True, True, False, False, False, False, False, False, False, False, False, True, False, True, True, False, True, False, False, False, False, False, True, True, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, False, True, False]

sel = SelectFromModel(RandomForestClassifier(n_estimators = 100), threshold = '1.25*mean') sel.fit(x_train, y_train) selected = sel.get_support() selected_list = list(selected) columns_list = [] for i in range(len(selected_list)): if(selected_list[i] == 'True'): columns_list.append(test[i]) print(columns_list)

Traceback (most recent call last): File "/opt/anaconda/envs/lib/python3.7/site-packages/pandas/core/indexes/base.py", line 2890, in get_loc return self._engine.get_loc(key) File "pandas/_libs/index.pyx", line 107, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/index.pyx", line 131, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/hashtable_class_helper.pxi", line 1607, in pandas._libs.hashtable.PyObjectHashTable.get_item File "pandas/_libs/hashtable_class_helper.pxi", line 1614, in pandas._libs.hashtable.PyObjectHashTable.get_item KeyError: 0 During handling of the above exception, another exception occurred: Traceback (most recent call last): File "/home/onur/Documents/Boston-Kaggle/Model.py", line 100, in <module> columns_list.append(test[i]) File "/opt/anaconda/envs/lib/python3.7/site-packages/pandas/core/frame.py", line 2975, in __getitem__ indexer = self.columns.get_loc(key) File "/opt/anaconda/envs/lib/python3.7/site-packages/pandas/core/indexes/base.py", line 2892, in get_loc return self._engine.get_loc(self._maybe_cast_indexer(key)) File "pandas/_libs/index.pyx", line 107, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/index.pyx", line 131, in pandas._libs.index.IndexEngine.get_loc File "pandas/_libs/hashtable_class_helper.pxi", line 1607, in pandas._libs.hashtable.PyObjectHashTable.get_item File "pandas/_libs/hashtable_class_helper.pxi", line 1614, in pandas._libs.hashtable.PyObjectHashTable.get_item KeyError: 0

2条回答

网友
1楼 · 编辑于 2024-05-16 04:52:34

我会这样做：
columns_list = list(x_train.columns[selected_list]) selected_test = test[columns_list]
这样，您就可以从x_train中检索所选列的名称，将它们放入column_list，然后在test中搜索它们。即使train和test数据没有相同数量的列，这种方法也应该有效；显然，如果test数据没有一个选定的特性，这种方法就行不通了。你知道吗

网友
2楼 · 编辑于 2024-05-16 04:52:34

你的问题是：
if(selected_list[i] == 'True'): columns_list.append(test[i])
将布尔值与字符串值'True'而不是True进行比较
一个紧凑的和脓性的解决方案是：
if selected_list[i]: columns_list.append(test[i])
对于第二个错误，这是因为您正在使用[]访问数据帧test。您需要使用方法.iloc
对于用法，取决于测试包含的内容：
test.iloc[0] # first row of data frame- Note a Series data type output. test.iloc[1] # second row of data frame test.iloc[-1] # last row of data frame # Columns: test.iloc[:,0] # first column of data frame test.iloc[:,1] # second column of data frame test.iloc[:,-1] # last column of data frame
编辑，更明确的解决方案：
columns_selected = test.iloc[:, [i for i in range(len(selected_list)) if selected_list[i]]]

相关问题更多 >

编程相关推荐

热门问题

热门文章