同时取消堆叠两列以生成连接的列

2024-06-14 02:08:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个分组的数据帧,看起来像:

Date         ID        Name       Category     Group        Amount
2018-02-28   123       ABC         Fruits      INT           22345
2018-02-28   456       JFGT        Veg         FEE           56789
2018-02-28   5687      AST         Seeds       FEE           4567
2018-02-28   5687      AST         Seeds       INT           236
.............
.............
2018-03-31   123       ABC         Fruits      INT           790
2018-03-31   456       JFGT        Veg         FEE           35637
2018-03-31   5687      AST         Seeds       FEE           4567
2018-03-31   5687      AST         Seeds       INT           236
.............
.............

我需要基本上按组和日期列取消对金额的堆叠,以创建如下内容:

ID      Name     Category   INT_2018-02  INT_2018-03   FEE_2018-02  FEE_2018-03
123      ABC         Fruits     22345        790       
456      JFGT        Veg                                   56789  35637 
5687     AST         Seeds                                 4567    4567
5687     AST         Seeds      236      236
.............
.............

它本质上是一个不稳定的过程。 我可以通过

 df = df.set_index(['Date','ID','Name','Category','Group'])['Amount'].unstack().reset_index()

但是,我不确定如何使用日期或unstack方法使用两列。 请告知


Tags: nameiddfdategroupastamountint
1条回答
网友
1楼 · 发布于 2024-06-14 02:08:49

添加新列:

df["GD"] = df["Group"] + "_" + df["Date"]

围绕新柱旋转DF:

result = df[["ID", "Name", "Category"]]\
        .join(df.pivot(None, "GD", "Amount"))\
        .fillna(" ") # The last line is not necessary
#     ID  Name Category FEE_2018-02-28 INT_2018-02-28
#0   123   ABC   Fruits                         22345
#1   456  JFGT      Veg          56789               
#2  5687   AST    Seeds           4567               
#3  5687   AST    Seeds                           236

相关问题 更多 >