在DateTIme上执行groupby后创建索引

df_mod=pd.read_csv('wet_bulb_hr.csv') #Mod Date df_mod['wbt_date'] = pd.to_datetime(df_mod['wbt_date']) #Mod Time df_mod['wbt_time'] = df_mod['wbt_time'].astype('int') df_mod['wbt_date'] = df_mod['wbt_date'] + \ pd.to_timedelta(df_mod['wbt_time']-1, unit='h') df_mod['wet_bulb_temperature'] = \ df_mod['wet_bulb_temperature'].astype('float') df = df_mod df = df.drop(['wbt_time','_id'], axis = 1) #df_novel = df.mean() df = df.groupby([df.wbt_date.dt.year,df.wbt_date.dt.month]).mean()

2条回答

网友

1楼 · 编辑于 2024-06-08 22:52:46

您可以通过列表理解将多索引展平到YYYY-MM中的索引：

df = df.groupby([df.wbt_date.dt.year,df.wbt_date.dt.month]).mean()
df.index = [f'{y}-{m}' for y, m in df.index]
df = df.rename_axis('date').reset_index()

或按^{}使用月周期：

df = df.groupby([df.wbt_date.dt.to_period('m')).mean().reset_index()

网友

2楼 · 编辑于 2024-06-08 22:52:46

试试这个

# rename exisiting index & on reset will get added as new column.

df.index.rename("wbt_year", inplace=True)
df.reset_index(inplace=True)
df['month'] = df['wbt_year'].astype(str) + "-" + df['wbt_date'].astype(str)

产出

>>> df['month']
0    2019-0
1    2018-1
2    2017-2

相关问题更多 >

编程相关推荐

热门问题

热门文章