在同一数据框架中联接行

2条回答

网友

1楼 · 编辑于 2024-06-02 05:56:42

我们可以在这里使用^{}和自定义aggfunc：

piv = df.pivot_table(index='username', columns='status', values='state', aggfunc=','.join)

status         ADD REMOVE
username                 
a         AR,AZ,CO     NY
b              NaN     CA

网友

2楼 · 编辑于 2024-06-02 05:56:42

很接近了，在reset_index使用^{}之前：

df1 = (df.fillna('')
         .groupby(['username', 'status'])['state'] \
         .apply(lambda x: ','.join(set(x)))
         .unstack(fill_value='')
         .reset_index()
         .rename_axis(None, axis=1))
print (df1)
  username       ADD REMOVE
0        a  AZ,AR,CO     NY
1        b               CA

或者将^{}与convert index to column by reset_index一起使用，并通过^{}删除列名：

df1 = (df.pivot_table(index='username', 
                     columns='status', 
                     values='state', 
                     aggfunc=lambda x: ','.join(set(x)), 
                     fill_value='')
         .reset_index()
         .rename_axis(None, axis=1))

print (df1)
  username       ADD REMOVE
0        a  AZ,AR,CO     NY
1        b               CA

编辑：

如果按3列使用^{}，则可以使用删除set的解决方案：

为了更好的解释，更改了样本数据：

d = {'username': ['a', 'a', 'b', 'a', 'a', 'a'],
     'state': ['AR', 'AZ', 'CA', 'CO', 'NY', 'NY'],
     'status': ['ADD', 'ADD', 'REMOVE', 'ADD', 'REMOVE','REMOVE']}
df = pd.DataFrame(data=d)
print (df)
  username state  status
0        a    AR     ADD
1        a    AZ     ADD
2        b    CA  REMOVE
3        a    CO     ADD
4        a    NY  REMOVE
5        a    NY  REMOVE <- added row

df1 = (df.pivot_table(index='username', 
                     columns='status', 
                     values='state', 
                     aggfunc=lambda x: ','.join(set(x)), 
                     fill_value='')
         .reset_index()
         .rename_axis(None, axis=1))

print (df1)
  username       ADD REMOVE
0        a  AZ,AR,CO     NY
1        b               CA

df1 = (df.drop_duplicates(['username','status','state'])
         .pivot_table(index='username', 
                     columns='status', 
                     values='state', 
                     aggfunc= ','.join, 
                     fill_value='')
         .reset_index()
         .rename_axis(None, axis=1))

print (df1)
  username       ADD REMOVE
0        a  AZ,AR,CO     NY
1        b               CA

相关问题更多 >

编程相关推荐

热门问题

热门文章

在同一数据框架中联接行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >