如何使用Pivot表Python创建重复行

2024-06-16 09:52:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在python中为dataframe创建重复的行。数据帧如下所示

SKU Ids wk_1 wk_2 wk_3 wk_4 wk_5 wk_6    

 10 20  1    2    3     4    5    6
 30 40  6    5    4     3    2    1

我要输出为

SKU Ids wk   value
 10 20 wk_1   1
 10 20 wk_2   2
 10 20 wk_3   3
 10 20 wk_4   4
 10 20 wk_5   5
 10 20 wk_6   6
 30 40 wk_1   6
 30 40 wk_2   5
 30 40 wk_3   4
 30 40 wk_4   3
 30 40 wk_5   2
 30 40 wk_6   1

我正在尝试使用pivot\u表,但它显示出错误

hqp = hq.pivot_table(columns=['sku', 'ids','value'], 
index= ['sku', 'ids'], 
values = ['wk_1', 'wk_2', 'wk_3', 'wk_4','wk_5', 'wk_6'])

Tags: columns数据idsdataframeindexvalue错误table
2条回答

这就是wide_to_long构建

pd.wide_to_long(df,['wk'],i=['SKU','Ids'],j='value',sep='_').reset_index()
Out[28]: 
    SKU  Ids  value  wk
0    10   20      1   1
1    10   20      2   2
2    10   20      3   3
3    10   20      4   4
4    10   20      5   5
5    10   20      6   6
6    30   40      1   6
7    30   40      2   5
8    30   40      3   4
9    30   40      4   3
10   30   40      5   2
11   30   40      6   1

SKUIds设为索引,^{}然后^{}^{}

df = df.set_index(['SKU','Ids'])\
       .stack().reset_index()\
       .rename(columns={'level_2':'wk',0:'value'})

或:

df = df.set_index(['SKU','Ids'])\
       .stack().reset_index(name='value')\
       .rename(columns={'level_2':'wk'})

或者根据注释中的^{}建议,使用^{}^{}的另一种方法:

df = df.melt(id_vars=['SKU','Ids'])\
       .rename(columns={'variable':'wk'})\
       .sort_values(['SKU','Ids'])

print(df)
    SKU  Ids    wk  value
0    10   20  wk_1      1
1    10   20  wk_2      2
2    10   20  wk_3      3
3    10   20  wk_4      4
4    10   20  wk_5      5
5    10   20  wk_6      6
6    30   40  wk_1      6
7    30   40  wk_2      5
8    30   40  wk_3      4
9    30   40  wk_4      3
10   30   40  wk_5      2
11   30   40  wk_6      1

相关问题 更多 >