在Python中,我有一个类似于以下内容的pandas数据框:
Item | shop1 | shop2 | shop3 | Category
------------------------------------
Shoes| 45 | 50 | 53 | Clothes
TV | 200 | 300 | 250 | Technology
Book | 20 | 17 | 21 | Books
phone| 300 | 350 | 400 | Technology
其中shop1、shop2和shop3是不同商店中每个商品的成本。 现在,我需要返回一个数据帧,在一些数据清理之后,像下面这样:
Category (index)| size| sum| mean | std
----------------------------------------
其中,尺寸是每类商品的数量和总和,平均值和标准值与适用于3个商店的相同功能相关。如何使用split apply combine模式(groupby、aggregate、apply…)执行这些操作?
有人能帮我吗?我要疯了…谢谢!
为Pandas 0.22+编辑,考虑到通过聚合在一个组中使用词典的不足。
我们建立了一个非常相似的字典,我们使用字典的键来指定我们的函数,并使用字典本身来重命名列。
选项1} ☆链接到文档
使用^{
选项2} ☆链接到文档
多多少少
使用^{
或者,如果你想在所有商店都买,那么:
如果我理解正确,您需要计算所有商店的汇总指标,而不是每个商店的汇总指标。为此,您可以首先^{} 数据帧,然后按
Category
分组:结果是
相关问题 更多 >
编程相关推荐