Python数据框架中列子集的groupby和mean

2条回答

网友

1楼 · 编辑于 2024-04-26 00:55:03

设置

df = df_dat.groupby(['Time', 'animal']).mean()
subsets = [["val","val3"], ["val2","val4"]]

使用词典理解和assign：

df.assign(**{'/'.join(cols): df[cols].mean(1) for cols in subsets})

             val  val2  val3   val4  val/val3  val2/val4
Time animal
yes  cat      20    10    10    NaN      15.0       10.0
     dog      20     4    60  350.0      40.0      177.0

如果只需要子集列：

pd.DataFrame({'/'.join(cols): df[cols].mean(1) for cols in subsets})

             val/val3  val2/val4
Time animal
yes  cat         15.0       10.0
     dog         40.0      177.0

网友

2楼 · 编辑于 2024-04-26 00:55:03

我相信你需要

ndf = df_dat.groupby(['Time', 'animal']).mean()
ndf['v1v3'], ndf['v2v4'] = ndf[['val', 'val3']].mean(1), ndf[['val2', 'val4']].mean(1)

输出

                val val2    val3    val4    v1v3    v2v4
Time    animal                      
yes     cat     20  10     10       NaN     15.0    10.0
        dog     20  4      60      350.0    40.0    177.0

当然，我们可以只选择平均列

ndf[['v1v3', 'v2v4']]

                v1v3    v2v4
Time    animal      
yes     cat     15.0    10.0
        dog     40.0    177.0

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python数据框架中列子集的groupby和mean

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >