如何使用python在不影响相应行的情况下，将行中的重复项交换为空白？

Column1 | Column2 | Column3 | .... Column n A | 10 | a A | 10 | b A | 10 | c B | 15 | d B | 15 | e B | 15 | f C | 20 | g C | 20 | h . . .

Column1 | Column2 | Column3 | .... Column n A | 10 | a | | b | | c B | 15 | d | | e | | f C | 20 | g | | h . . .

0条回答

网友

1楼 · 发布于 2024-04-24 19:54:34

您可以首先找到副本的索引

dup_index = df.duplicates().index

然后可以替换这些值

df.Column1.replace(dup_index,'')

如果您不希望像rchurt在评论中所说的那样使用空值，那么groupby（）也是一个不错的选择，如果您不希望使用空值，并让数据保持原样

网友

2楼 · 发布于 2024-04-24 19:54:34

您可以将mask与duplicated一起使用：

cols = ['Column1', 'Column2']
df[cols] = df[cols].mask(df.duplicated(cols), '')
df

输出：

  Column1 Column2 Column3
0       A      10       a
1                       b
2                       c
3       B      15       d
4                       e
5                       f
6       C      20       g
7                       h

相关问题更多 >

编程相关推荐

热门问题

热门文章