使用datafram选择带有除法运算符mysql的stament

+-----------------+-----------+ | CategoryCount | frequency | +-----------------+-----------+ | 0 | 123 | | 12 | 234 | | 15 | 456 | | 0 | 678 | | 25 | 890 | | 0 | 145 | +-----------------+-----------+

2条回答

网友

1楼 · 编辑于 2024-05-15 10:31:51

IIUC这将是相当的（10%，因为您的所有样本行<；75%）：

In [15]: df.frequency.sum()
Out[15]: 2526

In [16]: df.frequency / df.frequency.sum() < 0.1
Out[16]:
0     True
1     True
2    False
3    False
4    False
5     True
Name: frequency, dtype: bool

In [17]: df.loc[df.frequency / df.frequency.sum() < .1]
Out[17]:
   CategoryCount  frequency
0              0        123
1             12        234
5              0        145

In [18]: len(df.loc[df.frequency / df.frequency.sum() < .1])
Out[18]: 3

或者更好一点variant from @John Galt：

In [19]: (df.frequency < df.frequency.sum() * 0.1 ).sum()
Out[19]: 3

OP在SQL中的查询：

网友

2楼 · 编辑于 2024-05-15 10:31:51

注意：这并不能回答OP的问题。然而，正如@MaxU所指出的，它可能对其他人有所帮助。你知道吗

使用value_counts和normalize

df.CategoryCount.value_counts(normalize=True).lt(.75).sum()

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用datafram选择带有除法运算符mysql的stament

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >