无法平均数据帧中的特定行

2024-05-15 04:10:21 发布

您现在位置：Python中文网/ 问答频道 /正文

5383

网友

男 | 程序猿一只，喜欢编程写python代码。

我目前有以下两个数据帧：

原始数据=

     Time                             F1         F2        F3
2082-05-03 00:00:59.961599999  -83.769997      29.430000      29.400000   
2082-05-03 00:02:00.009600000  -84.209999      28.940001      28.870001   
2082-05-03 00:02:59.971200000  -84.339996      28.280001      28.320000

中断\u by \u timeofday \u num=（由原始数据生成）（忽略破折号-它们仅用于对齐）

                              F1     F2    F3  
Time                                                                        
2082-05-03 00:00:00           0      1     1   
2082-05-03 01:00:00           0      1     1

我已经能够使用以下代码（如下所示）按时间对原始数据数据帧进行排序和平均，但无法对中断数据帧按时间进行排序和平均：

这很有效：

raw_data = pd.read_excel(r'/Users/linnk ....
raw_data[u'Time']= pd.to_datetime(raw_data['Time'], unit='d')    
raw_data.set_index(pd.DatetimeIndex(raw_data[u'Time']), inplace=True) 
raw_data.Time = pd.to_datetime(raw_data.Time)

def time_cat(t):
    hour = t.hour
    if(hour >= 5 and hour < 9):
        return 'Morning (5AM-9AM)'
    elif(hour >= 9 and hour < 18):
        return 'Day (9AM-6PM)'
    elif(hour >= 18 and hour < 22):
        return 'Evening (6PM-10PM)'
    else:
        return 'Night (10PM-5AM)'

by_timeofday = raw_data.groupby(raw_data.Time.apply(time_cat)).mean()

按时间输出为：

                        F1              F2             F3  
Time                                                                       
Day (9AM-6PM)         -47.301852      23.070963      22.981000   
Evening (6PM-10PM)    -50.033000      24.011667      23.921833   
Morning (5AM-9AM)     -62.481130      48.417866      48.537197   
Night (10PM-5AM)      -71.372613     -71.289763      53.957411 \

但是，这不起作用：

outage_by_hour_num.Time= pd.to_datetime(outage_by_hour_num.Time)
outage_by_timeofday = outage_by_hour_num.groupby(outage_by_hour_num.Time.apply(time_cat)).sum(axis=1, numeric_only=True)

这会产生错误：AttributeError:'DataFrame'对象没有属性'Time'

有人能帮我找出我的错误/我需要做的编辑，以便按照我排序原始数据的方式，按天的时间对数据帧进行排序吗？在可能有用的情况下，已按以下方式按天的时间进行大修：

ave_data = raw_data.resample('h', how='mean')
ave_data.index.name=u'Time'
summary_ave_data = ave_data.copy()
summary_ave_data['Hourly Substation Average'] = summary_ave_data.mean(numeric_only=True, axis=1)
outage_by_hour = summary_ave_data >= 0.05
outage_by_hour_num= outage_by_hour.astype(int)

Tags：数据 data 原始数据 raw by return time 排序

1条回答

网友

1楼 · 发布于 2024-05-15 04:10:21

您在ave_data.index.name=u'Time'中删除了“Time”列。更改为：

ave_data.set_index('Time', drop=False, inplace=True)

这样可以确保将其设置为索引，但保留“Time”列。你知道吗

无法平均数据帧中的特定行

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法平均数据帧中的特定行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >