我有一个这样的数据框:
ind col1 col2
1 12 string1 ...
2 23 string2 ...
3 34 string1 ...
4 13 string2 ...
5 17 string3 ...
... ... ... ...
我想折叠数据帧,以便col2是唯一的。在col1(和所有其他的数值列)中,我想把col2相等的所有值的中值放进去。
我知道我可以提取df[df[“col2”]=“stringN”]、计算媒体并构建一个新的数据帧,但有没有更优雅/pythonic的方法来做到这一点?
Tags:
可以使用groupby收集行,方法是
col2
,然后.median()
:注意,结果也有
ind
值的中间值。另请参见.mean()
、.min()
、.max()
,如果您愿意,也可以自己滚动。相关问题 更多 >
编程相关推荐