在Python中,同时进行下采样和上采样是否很热?

2024-05-13 23:51:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个如下所示的数据帧:

log file

它是基于一种自动售货机的日志文件。DF由机器关闭(除准备就绪外)和重新启动(准备就绪)时的时间点进行索引。列“downtime”表示机器关闭的时间(以秒为单位)(错误发生和下次重新启动之间的时间差)。我希望看到这段停机时间按小时分组。问题是,有时行之间的间隔小于,有时大于一个小时。使用简单的重采样代码时,如下所示:

data_uptime3=data_uptime2.resample('H').sum()

我得到的东西适用于距离不到一小时的行,但不适用于更长的时间:

dataframe2

相反,我希望将从第一行开始的82201秒分为3600秒,在这些较长的时间段内每小时一秒(该时间段的第一个和最后一个小时对应的秒数),以及在记录距离小于一小时的情况下每小时的秒数总和(现在是这样)。最后,我想知道机器每小时停机的百分比。很抱歉链接,我刚开始积极使用堆栈。 你能帮我做这个吗


Tags: 文件数据机器log距离dfdata时间