消除特征的特征化器

from dml_iv.utilities import SubsetWrapper, ConstantModel from econml.sklearn_extensions.linear_model import StatsModelsLinearRegression col = ["A_"+str(k) for k in range(XW.shape[1])] XW_db = pd.DataFrame(XW, columns=col) from sklearn_pandas import DataFrameMapper subset_names = set(['A_0','A_1','A_2','A_3','A_4','A_5','A_6','A_7','A_8','A_9','A_10']) # list of indices of features X to use in the final model mapper = DataFrameMapper([ ('A_0', PolynomialFeatures(1)), ('A_1', PolynomialFeatures(1)), ('A_2', PolynomialFeatures(1)), ('A_3', PolynomialFeatures(1)), ('A_4', PolynomialFeatures(1)), ('A_5', PolynomialFeatures(1)), ('A_11 - A_66', ?)]) ## PROBLEMATIC PART

1条回答

网友

1楼 · 发布于 2024-05-14 15:55:22

为什么不从数据帧中删除不需要的列并映射剩下的内容

cols_map = [...] # list of columns to map
cols_drop = [...] # list of columns to drop
XW_db = XW_db.drop(cols_drop, axis=1) # you're left with only what to map
mapper = DataFrameMapper(cols_map)
...

如果不希望删除列的原因是以后将使用这些列，则可以简单地将删除结果分配给其他变量，从而创建几个更易于操作的子集数据帧：

df2 = df1.drop(cols_drop2,axis=1) # df2 is a subset of df1
df3 = df1.drop(cols_drop3,axis=1) # df3 is a subset of df1
# Alternative is to decide what to keep instead of what to drop
df4 = df1[cols_keep] # df4 is a subset of df1
# df1 remains the full dataframe

相关问题更多 >

编程相关推荐

热门问题

热门文章