Pandas如何从聚合中按类别定位？

import pandas as pd import numpy as np A = np.random.random(10000) bins = np.arange(0, max(A), 0.03) data_bins = pd.cut(A, bins = bins, precision = 100) df = pd.DataFrame({"A": A, "bin": data_bins})\ .sort_values(by = ["bin"])\ .reset_index(drop = True)\ .dropna() print(df.head()) # For example, only take bins with more than 310 entries in each valid_bins = df.groupby("bin")[["A"]].count().query("A > 310") print(valid_bins)

1条回答

网友

1楼 · 发布于 2024-04-26 05:25:08

我认为您需要^{}用于Series，其大小与原始DataFrame相同，因此可以通过^{}进行过滤：

df1 = df[df.groupby("bin")["A"].transform('count') > 310]

或者将slowier溶液与filtration一起使用：

df1 = df.groupby("bin").filter(lambda x: x["A"].count() > 310)

print(df1.head())
            A           bin
674  0.080059  (0.06, 0.09]
675  0.074179  (0.06, 0.09]
676  0.062529  (0.06, 0.09]
677  0.087312  (0.06, 0.09]
678  0.070065  (0.06, 0.09]

编程相关推荐

如何在不使用java安装outlook的情况下以编程方式创建pst文件？
如何在java中比较泛型方法中的数组？
JavaFXHTML节点元素
java H2数据库要降低的连接设置无效（2019）
安卓 hilt中的java依赖循环
java这个结构什么时候有意义？
带有模式和匹配器的Java正则表达式
来自类变量的java JNI jstring？
尝试从socket读取时发生java非法阻止模式异常
绑定中使用Moxy的java接口映射。xml不能使用多个接口？

相关问题更多 >

编程相关推荐

热门问题

热门文章