根据最频繁值删除列

1条回答

网友

1楼 · 发布于 2024-06-12 04:30:44

是的，那是可能的。你知道吗

考虑以下数据帧：

prng = np.random.RandomState(0)
df = pd.DataFrame(prng.choice([1, 2, 3], p=[0.7, 0.15, 0.15], size=(100, 5)))

您可以通过以下方式获得每列的每个唯一值的百分比：

df.apply(pd.Series.value_counts, normalize=True)
Out: 
      0     1     2     3     4
1  0.77  0.73  0.78  0.62  0.70
2  0.09  0.14  0.07  0.18  0.12
3  0.14  0.13  0.15  0.20  0.18

请注意，前三列具有高于70%出现率的唯一值。您可以按每列的最大值检查，并将其作为布尔数组传递：

df.apply(pd.Series.value_counts, normalize=True).max() > 0.7
Out: 
0     True
1     True
2     True
3    False
4    False
dtype: bool

现在，如果只想选择具有<；70%唯一值的，请使用：

df.loc[:, ~(df.apply(pd.Series.value_counts, normalize=True).max() > 0.7)]
Out: 
    3  4
0   1  1
1   3  1
2   3  1
3   2  3
4   2  1
...

编程相关推荐

java多线程秒表
java如何防止ConcurrentModificationException？
java我们如何实现组发送消息功能？
java如何从jQueryAjax调用调用SpringMVC控制器
类如何正确使用Java客户机/服务器类
java R无法解析为变量（新的安卓项目）
带有多过滤器选项的java Javafx TableView
udp Java DatagramSocket在几次运行后抛出SocketTimeoutException
swing Java GUI布局建议
java有办法在到期时重建ehcache吗

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据最频繁值删除列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >