Pandas：根据特定列的值计数选择行

df=pd.DataFrame({'sym':['a', 'b', 'b', 'c', 'd','d','d','e','e'],'price':np.random.randn(9)}) price sym 0 -0.0129 a 1 -1.2940 b 2 1.8423 b 3 -0.7160 c 4 -2.3216 d 5 -0.0120 d 6 -0.5914 d 7 0.6280 e 8 0.5361 e df.sym.value_counts() Out[237]: d 3 e 2 b 2 c 1 a 1

1条回答

网友

1楼 · 发布于 2024-06-06 22:01:37

我认为您可以使用^{}by columnsym和^{}值和length == 2：

print df.groupby("sym").filter(lambda x: len(x) == 2)
      price sym
1  0.400157   b
2  0.978738   b
7 -0.151357   e
8 -0.103219   e

第二种解决方案使用^{}和boolean indexing：

s = df.sym.value_counts()

print s[s == 2].index
Index([u'e', u'b'], dtype='object')

print df[df.sym.isin(s[s == 2].index)]
      price sym
1  0.400157   b
2  0.978738   b
7 -0.151357   e
8 -0.103219   e

最快的解决方案是^{}和^{}：

print (df[df.groupby("sym")["sym"].transform('size') == 2])
    price sym
1 -1.2940   b
2  1.8423   b
7  0.6280   e
8  0.5361   e

编程相关推荐

java如何通过编程更改安卓中imagebutton的大小
Java Web应用程序中的angularjs路由
以更智能的方式在JUnit5（或其他测试Java库）中使用数组进行参数化
java在16位颜色深度的Graphics2D中绘制时颜色错误
java有可能在需要时从Firebase手动检索数据，以及如何组合查询？
格拉德尔爪哇。lang.NoSuchFieldError:md2
java中的循环乘法表错误
用于检测圆括号的java正则表达式
如果我们使用新字符串（“abcd”），java就是在堆中创建的字符串对象
java有没有办法让JOptionPane下拉菜单为所选选项输出数字？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas：根据特定列的值计数选择行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >