假设我们有一个1000行100列的数据框。第一列是名称,其余为值或空。许多行具有相同的名称。我如何添加它们,并将每个名称与值的总和相加一次
例如,第一行的名称Alex的值为20、30、40,另外两行的名称Alex的值分别为10、10、20。因此,我的新数据帧应该只包含一行Alex,其值为40、50、80
编辑:首先感谢大家的反馈。对不起,我不清楚。假设我有下面的矩阵
Names Last name price1 price2 price3 (no named column)
-------------------------------------------------------------------------
Alex Robinson 10 20 30 (a string)
Bill Towns 10 40 50 (empty)
Alex Robinson 30 10 20 (empty)
George Leopold 10 10 10 (empty)
Alex Robinson 20 20 20 (empty)
Names Last name price1 price2 price3 (no named column)
(no named row)
---------------------------------------------------------------------------
Alex Robinson 60 50 70 (a string)
Bill Towns 10 40 50 (empty)
George Leopold 10 10 10 (empty)
但不是3列,而是想象我有100列。因此,我不能明确地以他们的名字为例
EDIT2:我忘了告诉你,有些行还包含字符串。不幸的是,这个命令有一个错误
df8 = data.groupby('Name').sum()
我已经用这个命令对数据帧进行了排序
data2 = data.sort_values('Name',ascending=True).reset_index(drop=True)
下面是将您的分数相加的代码:
结果是: 之前:
及之后:
你可以用
df.groupby
来做输出
相关问题 更多 >
编程相关推荐