Pandas重复属性之和

2024-05-14 10:53:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用Pandas操作一个csv文件,该文件有几行和几列,如下所示

Fullname     Amount     Date           Zip    State .....
John Joe        1        1/10/1900     55555    Confusion
Betty White     5         .             .       Alaska 
Bruce Wayne     10        .             .       Frustration
John Joe        20        .             .       .
Betty White     25        .             .       .

我想为每个人创建一个名为“总计”的新列,其中包含总计金额。(由全名和邮政编码标识)。我很难找到正确的解决办法。

让我们调用我的csv导入csvfile。这是我有的。

import Pandas
df = pandas.read_csv('csvfile.csv', header = 0) 
df.sort(['fullname'])

我想我必须用它来做我想做的事情。删除重复项的问题是,我将丢失数量或数量可能不同。


Tags: 文件csvcsvfilepandasdf数量datezip
1条回答
网友
1楼 · 发布于 2024-05-14 10:53:29

我想你想要这个:

df['Total'] = df.groupby(['Fullname', 'Zip'])['Amount'].transform('sum')

所以groupby将按Fullnamezip列分组,正如您所说,然后我们调用Amount列上的^{}并通过传入字符串sum计算总量,这将返回一个索引与原始df对齐的序列,然后可以删除重复项。e、 g

new_df = df.drop_duplicates(subset=['Fullname', 'Zip'])

相关问题 更多 >

    热门问题