我正试图找到一种方法来获取按主机分组并按时间排序的连续事件组。理想情况下,我需要满足某个treshold和isCorrect == false
的组
范例
Time | Host | isCorrect |
-------------------------------------
10:01 | HostA | true |
10:02 | HostB | true |
10:03 | HostA | false |
10:15 | HostA | false |
10:16 | HostA | false |
10:18 | HostB | false |
10:20 | HostA | true |
10:21 | HostA | true |
10:22 | HostB | false |
10:23 | HostB | false |
阈值:>=三,
将导致两组
Time | Host | isCorrect | Group
--------------------------------------------
10:03 | HostA | false |1
10:15 | HostA | false |1
10:16 | HostA | false |1
10:18 | HostB | false |2
10:22 | HostB | false |2
10:23 | HostB | false |2
我正在读https://towardsdatascience.com/pandas-dataframe-group-by-consecutive-certain-values-a6ed8e5d8cc,但找不到先按主机分组的方法
首先通过使用} 创建
~
反转掩码和排序值(如有必要)过滤False
值,然后使用阈值过滤组,最后通过^{Group
列:如果按连续的
False
分组:相关问题 更多 >
编程相关推荐