将行值转换为datafram中现有的预定义列

| Name | Category | Amount | |------|----------|--------| | Abel | A | 9.2 | | Abel | B | 3 | | Abel | C | 2.5 | | Abel | E | 2 | | Abel | X | 0 | | Cain | W | 93 | | Cain | A | 2 | |------|----------|--------|

| Name | Cat 1 | Cat 2 | Cat 3 | Cat 4 | Cat 5 | |------|-------|-------|-------|-------|-------| | Abel | A | B | C | E | X | | Cain | W | A | - | - | - | |------|-------|-------|-------|-------|-------|

| Name | Category | Amount | |------|----------|--------| | Abel | A | 9.2 | | Abel | B | 3 | | Cain | W | 93 | | Cain | A | 2 | |------|----------|--------| should still give me this: | Name | Cat 1 | Cat 2 | Cat 3 | Cat 4 | Cat 5 | |------|-------|-------|-------|-------|-------| | Abel | A | B | - | - | - | | Cain | W | A | - | - | - | |------|-------|-------|-------|-------|-------|

1条回答

网友

1楼 · 发布于 2024-05-23 18:45:13

用途：

#create counter column used for later columns names
df['g'] = df.groupby('Name').cumcount().add(1)
#filter top3
df = df[df['g'] <= 5]
#reshape by pivot
df2 = (df.pivot('Name','g','Category')
         .add_prefix('Type ')
         .reset_index()
         .rename_axis(None, axis=1)
         .fillna('-'))
print (df2)
   Name Type 1 Type 2 Type 3 Type 4 Type 5
0  Abel      A      B      C      E      X
1  Cain      W      A      -      -      -

编辑：使用^{}添加缺少的列：

df['g'] = df.groupby('Name').cumcount().add(1)
#filter top3
df = df[df['g'] <= 5]
#reshape by pivot
df2 = (df.pivot('Name','g','Category')
         .reindex(range(1, 6), axis=1)
         .add_prefix('Type ')
         .reset_index()
         .rename_axis(None, axis=1)
         .fillna('-'))
print (df2)
   Name Type 1 Type 2 Type 3 Type 4 Type 5
0  Abel      A      B      -      -      -
1  Cain      W      A      -      -      -

相关问题更多 >

编程相关推荐

热门问题

热门文章