我有以下格式的数据(见下文)
接下来,我将执行重铸、分组和平均(参见代码),以降低数据维度
df_mod=pd.read_csv('wet_bulb_hr.csv')
#Mod Date
df_mod['wbt_date'] = pd.to_datetime(df_mod['wbt_date'])
#Mod Time
df_mod['wbt_time'] = df_mod['wbt_time'].astype('int')
df_mod['wbt_date'] = df_mod['wbt_date'] + \
pd.to_timedelta(df_mod['wbt_time']-1, unit='h')
df_mod['wet_bulb_temperature'] = \
df_mod['wet_bulb_temperature'].astype('float')
df = df_mod
df = df.drop(['wbt_time','_id'], axis = 1)
#df_novel = df.mean()
df = df.groupby([df.wbt_date.dt.year,df.wbt_date.dt.month]).mean()
在写入输出文件后,我得到了如下输出
进一步调查,我能理解原因。我所有的处理都产生了形状为1的数据框,但我真正需要的是还要导出2个wbt_日期列。由于groupby函数的缘故,这种情况似乎不会发生
您可以通过列表理解将多索引展平到
YYYY-MM
中的索引:或按^{} 使用月周期:
试试这个
产出
相关问题 更多 >
编程相关推荐