import pandas as pd
row_1 = pd.Series({'Address A': 3647,
'Address B': 555,
'Total Delay': 1.2})
row_2 = pd.Series({'Address A': 555,
'Address B': 3647,
'Total Delay': 2.1})
row_3 = pd.Series({'Address A': 4567,
'Address B': 555,
'Total Delay': 0.6})
df = pd.DataFrame([row_1, row_2, row_3], index = [1, 2, 3])
df.head()
output:
Address A Address B Total Delay
1 3647 555 1.2
2 555 3647 2.1
3 4567 555 0.6
假设我有上面的数据帧,我如何将1和2分组为[3647555],如果它们在行中是相同的,并将它们的总延迟添加到3.3,从而得到一个新的数据帧。你知道吗
我要再做5万个数据。你知道吗
Address A Address B Total Delay
1 3647 555 3.3
3 4567 555 0.6
首先,我们用
np.sort
对索引轴(每行)上的Address A
和Address B
进行排序。然后我们GroupBy
在这些列上使用sum
+first
:如果希望列的顺序与此完全一致,请使用
DataFrame.reindex
:相关问题 更多 >
编程相关推荐