Pandas如何处理重复索引？

2条回答

网友

1楼 · 编辑于 2024-04-26 20:25:42

我认为当所有值都相同时，pandas会忽略索引。如果添加另一个值，则会得到不同的结果：

x = pd.Series(range(5,10), index = ['a' for _ in range(4)]+['b'])
y = pd.Series(range(-5,-10, -1), index = ['b']+['a' for _ in range(4)])

与

以及

y

b   -5
a   -6
a   -7
a   -8
a   -9

现在，您将得到以下结果：

x+y

a   -1
a   -2
a   -3
a   -4
a    0
a   -1
a   -2
a   -3
a    1
a    0
a   -1
a   -2
a    2
a    1
a    0
a   -1
b    4

重复索引会导致x和y中'a'上所有可能匹配项的附加行。你知道吗

网友

2楼 · 编辑于 2024-04-26 20:25:42

基于@othman nejjar的评论

您可以使用：

pd.Series([1,2], index=['a', 'b']).add(pd.Series([-1,-2], index=['b', 'a']))

输出：

a   -1
b    1
dtype: int64