Groupby和sum by 1列，保留所有其他列，并变异一个新列，使用Pandas计数求和的行

customer_id amount male age income days reward difficulty duration 0 id_1 16.06 1 45 62000.0 608 2.0 10.0 10.0 1 id_1 18.00 1 45 62000.0 608 2.0 10.0 10.0

3条回答

网友

1楼 · 编辑于 2024-05-13 20:44:58

基于@Scott Boston的回答，我自己也找到了答案，我承认我的解决方案并不优雅（也许有什么东西可以帮助清理它）。但当我有非唯一行（例如，每个customer_id有五个不同的事务）时，它为我提供了一个扩展的解决方案

df.groupby('customer_id').agg({'amount':['sum'], 'reward_':['sum'], 'difficulty':['mean'], 
                                            'duration':['mean'], 'male':['mean'], 'male':['mean'], 
                                            'income':['mean'], 'days':['mean'], 'age':['mean'], 
                                            'customer_id':['count']}).reset_index()

df_grouped = starbucks_grouped.droplevel(1, axis = 1)

我的输出是

网友

2楼 · 编辑于 2024-05-13 20:44:58

您可以这样做，包括groupby中的所有其他列，然后在聚合后重置索引：

df.groupby(df.columns.difference(['amount']).tolist())['amount']\
  .agg(total_sum='sum',total='count').reset_index()

输出：

   age customer_id  days  difficulty  duration   income  male  reward  total_sum  total
0   45        id_1   608        10.0      10.0  62000.0     1     2.0      34.06      2

网友

3楼 · 编辑于 2024-05-13 20:44:58

你可以做：

grouper = df.groupby('customer_id')
first_dict = {col: 'first' for col in df.columns.difference(['customer_id', 'amount'])}
o = grouper.agg({
     'amount': 'size', 
     **first_dict,
})
o['total'] = grouper.size().values

相关问题更多 >

编程相关推荐

热门问题

热门文章

Groupby和sum by 1列，保留所有其他列，并变异一个新列，使用Pandas计数求和的行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >