假设我们在excel上有以下数据
Column1 | Column2 | Column3 | .... Column n
A | 10 | a
A | 10 | b
A | 10 | c
B | 15 | d
B | 15 | e
B | 15 | f
C | 20 | g
C | 20 | h
.
.
.
我想把它修改成
Column1 | Column2 | Column3 | .... Column n
A | 10 | a
| | b
| | c
B | 15 | d
| | e
| | f
C | 20 | g
| | h
.
.
.
我尝试使用drop_duplicates(来自pandas)技术,但它也删除了其他行
我可以手动完成这项任务,但我正试图通过使用python找到实现上述目标的方法,有什么想法吗
您可以首先找到副本的索引
dup_index = df.duplicates().index
然后可以替换这些值
df.Column1.replace(dup_index,'')
如果您不希望像rchurt在评论中所说的那样使用空值,那么groupby()也是一个不错的选择,如果您不希望使用空值,并让数据保持原样
您可以将
mask
与duplicated
一起使用:输出:
相关问题 更多 >
编程相关推荐