早上好! 我正在尝试使用panda从csv文件中删除重复的行。 我有两个文件,A.csv和B.csv 我想删除A中存在于B中的所有行
文件A.csv:
Pedro,10,rojo
Mirta,15,azul
Jose,5,violeta
文件B.csv:
Pedro,
ignacio,
fernando,
federico,
输出文件Output.csv:
Mirta,15,azul
Jose,5,violeta
尝试加入文件,然后应用
cat A.csv B.csv > output.csv
并在python中运行此程序:
import pandas as pd
df = pd.read_csv('output.csv')
df.drop_duplicates(inplace=True)
df.to_csv('final.csv', index=False)
导入df_A和df_B中的A.csv和B.csv
然后,附加df_ab的两个数据帧:
df_ab = df_a.append(df_b)
然后查找重复的行:
df_ab_only_duplicated_values = df_ab[df_ab.duplicated()]
将df_a附加到df_ab_only_duplicated_值,并删除所有重复的行:
df_a = df_a.append(df_ab_only_duplicated_values).drop_duplicates(keep=False)
相关问题 更多 >
编程相关推荐