计算事件持续时间

2024-04-25 13:32:30 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图遵循this SO post的第一个答案来计算事件持续时间。文章中的例子是降雨持续时间,人们想知道降雨的总和和降雨事件的持续时间(以小时为单位)。你知道吗

我的场景是一个类似的时间序列,但是应用程序是一个泵,我想知道泵每天运行的总持续时间(小时)。我的数据是一个泵速命令,任何时候泵速大于0.0泵运行。你知道吗

首先,我正在将我的CSV文件读入Pandas。你知道吗

#read CSV file
df = pd.read_csv('C:\\Users\\desktop\\data.csv', index_col='Date', parse_dates=True)

# Converting the index as date
df.index = pd.to_datetime(df.index)

df

除非我在尝试将Date索引转换为日期时间时遇到问题。返回ValueError: day is out of range for month

有人知道怎么解决这个问题吗?最后,这是我试图重新创建的代码,从SO post第一个答案,作者正在创建帮助列。。。你知道吗

# create helper columns defining contiguous blocks and day
df['block'] = (df['Pump4VFD'].astype(bool).shift() != df['Pump4VFD'].astype(bool)).cumsum()
df['day'] = df.index.dt.normalize()

# group by day to get unique block count and value count
session_map = df[df['value'].astype(bool)].groupby('day')['block'].nunique()
hour_map = df[df['value'].astype(bool)].groupby('day')['value'].count()

# map to original dataframe
df['sessions'] = df['day'].map(session_map)
df['hours'] = df['day'].map(hour_map)

# calculate result
res = df.groupby(['day', 'hours', 'sessions'], as_index=False)['value'].sum()
res['duration'] = res['hours'] / res['sessions']
res['amount'] = res['value'] / res['sessions']

我的数据如下:

                    Pump4VFD
Date                                                                    
1/0/00 12:45 AM          0.0
1/0/00 12:50 AM          0.0
1/0/00 12:55 AM          0.0
1/0/00 12:00 AM          0.0
1/0/00 1:05 AM           0.0

Tags: tomapdfdateindexvalueresam
1条回答
网友
1楼 · 发布于 2024-04-25 13:32:30

您可能需要将dayfirst=True添加到pd.to\ U日期时间你知道吗

df.index = pd.to_datetime(df.index,dayfirst=True)

这可能是一种方法;但如果不起作用,请尝试以下添加:

df.index = pd.to_datetime(df.index,dayfirst=True,infer_datetime_format=True)

如果您需要进一步的澄清,请尝试以下帖子:ValueError: day is out of range for month

相关问题 更多 >