将数据帧按特定列压缩到包含第一个和最后一个时间戳以及值的平均值的行

timestamp value mark 1 2016-11-07 11:00:00 0.781726 1 2 2016-11-07 11:03:00 0.812757 2 3 2016-11-07 11:05:00 0.845348 2 4 2016-11-07 11:07:00 0.817394 2 5 2016-11-07 11:11:00 0.760787 1 6 2016-11-07 11:13:00 0.807892 1 7 2016-11-07 11:15:00 0.812965 1 8 2016-11-07 11:18:00 0.822001 1

1条回答

网友

1楼 · 发布于 2024-04-25 17:15:53

您需要从重复列mark到Series的唯一groups，然后是^{}^{}，^{}和{a5}：

print ((df.mark != df.mark.shift()).cumsum())
1    1
2    2
3    2
4    2
5    3
6    3
7    3
8    3
Name: mark, dtype: int32

df1 = df.groupby((df.mark != df.mark.shift()).cumsum()) \
         .agg({'timestamp': ['first','last'], 'value':'mean', 'mark': 'first'})

#reset MultiIndex in columns
df1.columns = ['_'.join(col) for col in df1.columns]
#if necessary rename columns
df1 = df1.rename(columns=({'timestamp_first':'start_timestamp', 
                           'timestamp_last':'end_timestamp',
                           'mark_first':'mark','value_mean':'(mean_)value'})) \
          .rename_axis(None)

print (df1)         
      start_timestamp       end_timestamp  mark  (mean_)value
1 2016-11-07 11:00:00 2016-11-07 11:00:00     1      0.781726
2 2016-11-07 11:03:00 2016-11-07 11:07:00     2      0.825166
3 2016-11-07 11:11:00 2016-11-07 11:18:00     1      0.800911

相关问题更多 >

编程相关推荐

热门问题

热门文章

将数据帧按特定列压缩到包含第一个和最后一个时间戳以及值的平均值的行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >