如何在具有聚合函数的Pandas中按相同值“合并”列？

示例

#!/usr/bin/env python """Test data frame grouping.""" # 3rd party modules import pandas as pd df = pd.DataFrame([{'id': 1, 'price': 123, 'name': 'anna', 'amount': 1}, {'id': 1, 'price': 7, 'name': 'anna', 'amount': 2}, {'id': 2, 'price': 42, 'name': 'bob', 'amount': 30}, {'id': 3, 'price': 1, 'name': 'charlie', 'amount': 10}, {'id': 3, 'price': 2, 'name': 'david', 'amount': 100}]) print(df)

提供数据帧：

amount id name price 0 1 1 anna 123 1 2 1 anna 7 2 30 2 bob 42 3 10 3 charlie 1 4 100 3 david 2

我想得到：

amount id name price 3 1 anna 130 30 2 bob 42 110 3 charlie 3

所以：

在id列中具有相同值的条目属于一起。在该操作之后，仍然应该有一个id列，但它应该只有唯一的值。

将amount和price中具有相同id的所有值相加

对于name，只取第一个（按数据帧的当前顺序）。

这对熊猫有可能吗？

2条回答

网友

1楼 · 编辑于 2024-05-23 14:24:57

对于相同的列，必须添加^{}，因为按dict聚合：

d = {'price': 'sum', 'name': 'first', 'amount': 'sum'}
df_new = df.groupby('id', as_index=False).aggregate(d).reindex(columns=df.columns)
print (df_new)
   amount  id     name  price
0       3   1     anna    130
1      30   2      bob     42
2     110   3  charlie      3

网友

2楼 · 编辑于 2024-05-23 14:24:57

你在找

aggregation_functions = {'price': 'sum', 'amount': 'sum', 'name': 'first'}
df_new = df.groupby(df['id']).aggregate(aggregation_functions)

它给予

    price     name  amount
id                        
1     130     anna       3
2      42      bob      30
3       3  charlie     110

示例

相关问题更多 >

编程相关推荐

热门问题

热门文章