我有一个由不同世界区域组成的数据集,我有一个groupby参数,我不仅要包括当前输出,还要包括每个min和max函数的相关日期:
dfmin2 = df2.groupby('Region')['Student'].agg(['sum','min','max','mean']
产生:
Region sum min max mean
Canada 5 1 3 2.5
Mexico 10 2 6 5
我想:
Region sum min min date max max date mean
Canada 5 1 year 6 3 year 2 2.5
Mexico 10 2 year 8 6 year 9 5
其中“最小日期”和“最大日期”与“最小/最大值”列的“最小/最大值”以数字形式出现的时间相连接。i、 例如,我的数据集长达16年,我不希望每种情况下的最小值和最大值分别为1年和16年,除非恰好是这样(这是不可能的)
目前没有回答
相关问题 更多 >
编程相关推荐