插补后知道特征名称

2条回答

网友

1楼 · 编辑于 2024-04-27 03:23:15

您可以这样做：

invalid_mask = np.isnan(imp.statistics_)
valid_mask = np.logical_not(invalid_mask)
valid_idx, = np.where(valid_mask)

现在您有了有效列的旧索引（这些列在矩阵X中的索引）。您可以通过这些索引从旧X的特性名称列表中获取特性名称

网友

2楼 · 编辑于 2024-04-27 03:23:15

这比它应该做的更困难。答案是SimpleImputer应该得到一个参数add_indicator=True。然后，试穿后，简单_输入指示器获取该类型的另一个转换器的值sklearn.impute.MissingIndicator公司. 这又将有一个变量features_u，其中包含这些特性。在

大致如下：

simple_imputer = SimpleImputer(add_indicator=True)
simple_imputer.fit(X)
print(simple_imputer.indicator_.features_)

我在SimpleImputer上实现了一个瘦包装器，名为SimpleImputerWithFeatureNames，它为您提供特性名称。它在github上提供。在

^{pr2}$