如何让pandas获取哑变量表现像DictVectorizer

pd.get_dummies(df) carrot apple_3 apple_4 apple_ pear_2 pear_3 pear_ 0 1 1 0 0 0 0 1 1 3 0 0 1 1 0 0 2 1 0 1 0 0 1 0

3条回答

网友

1楼 · 编辑于 2024-04-19 14:53:19

我不能让pandas.get_dummies()像这样工作，而且我不认为它被设置为只能为某些值创建分类变量。在

我制作了this Gist，它提供了您想要的输出。它applies是一个用1代替空值，用0代替非空值的函数。然后，您可以将这个新的数据帧与原始的数据帧合并以获得所需的结果。在

网友

2楼 · 编辑于 2024-04-19 14:53:19

我认为get_dummies做不到。在

但是this answer使用DictVectorizer直接传递数据帧，它将避免转换为dict。在

网友

3楼 · 编辑于 2024-04-19 14:53:19

以下（pratapvardhan）作品：

dfn = df.apply(pd.to_numeric, errors='coerce').isnull() # or df.applymap(np.isreal)
df.mask(dfn, 0).join(pd.get_dummies(df.where(dfn)).filter(like='_'))

比较一下这个解决方案的速度是非常有趣的。在

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何让pandas获取哑变量表现像DictVectorizer

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >