如何找到数据框中出现最多的行项目

2024-05-15 19:30:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一个数据帧:

    a   b   c   d   e   f
  ------------------------
0   0   0   1   1   0   1
1   1   0   1   1   0   0
2   0   0   1   1   0   1
3   1   0   1   0   0   0
4   0   0   1   1   0   1
5   0   1   1   0   0   0
6   1   0   1   0   1   1
7   0   0   1   1   0   1
8   1   0   1   1   1   0
9   0   0   1   1   0   1

如何找出哪一行出现的次数最多和唯一项计数? 在这里0 0 1 1 0 1这在第0,2,4,7,9行中出现的次数最多

我试过apriori algorithm,但是如果我的数据很大,它会给我100多条规则。 .NB:我的真实数据不是01。这是模拟数据


Tags: 数据规则次数algorithm计数nbapriori
1条回答
网友
1楼 · 发布于 2024-05-15 19:30:56

使用^{}by all columns with size和for index by max value add ^{}

out = df.groupby(df.columns.tolist()).size().idxmax()
print (out)
(0, 0, 1, 1, 0, 1)

对于具有compare by max值的索引值^{}

s = df.groupby(df.columns.tolist())[df.columns[0]].transform('size')
idx = s.index[s == s.max()]
print (idx)
Int64Index([0, 2, 4, 7, 9], dtype='int64')

相关问题 更多 >