如何识别dataframe中有重复的列名?

2024-05-26 07:48:19 发布

您现在位置:Python中文网/ 问答频道 /正文

表:

   Name   Name   RollNo   Class
0  Harry  zim    10230     4
1  tim    rim    10230     4
2  brom   kim    10230     4
3  juil   lim    10230     4

读取csv时,前两列转换为Name和Name.1 但我需要的布尔答案,我正在阅读的文件有重复列或没有


Tags: 文件csv答案nameclasstimkimzim
2条回答

如果所有带有附加.1的列都不应该与.1一起,您可以尝试:

print(len(df.columns) != len(df.columns.str.replace('.1$', '').drop_duplicates()))

输出:

True

对于列不重复的数据帧,它将给出False

注意:对于具有重复列的数据帧,它给出了True;对于没有重复列的数据帧,它给出了False

使用^{}^{}keep=False测试所有重复项,最后测试至少一个匹配项,这意味着^{}至少有一个True

print (df.columns.str.replace('\.1$', '').duplicated(keep=False).any())
True

相关问题 更多 >