我正在使用Python Pandas尝试将CSV2中的引用与CSV1中的数据进行匹配,并创建一个新的输出文件。你知道吗
CSV1
reference,name,house
234 8A,john,37
564 68R,bill,3
RT4 VV8,kate,88
76AA,harry ,433
CSV2
reference
234 8A
RT4 VV8
代码
import pandas as pd
df1 = pd.read_csv(r'd:\temp\data1.csv')
df2 = pd.read_csv(r'd:\temp\data2.csv')
df3 = pd.merge(df1,df2, on= 'reference', how='inner')
df3.to_csv('outpt.csv')
当我运行它的时候,我得到了一个keyerror作为参考,是不是数据中的空格导致了这个问题?数据以逗号分隔。你知道吗
很可能在读取CSV文件后,
reference
列中有前导空格或尾随空格。你知道吗您可以这样检查:
您可以通过向
pd.read_csv()
调用添加sep=r'\s*,\s*'
参数来“修复”它示例:
固定
df2
:现在起作用了:
相关问题 更多 >
编程相关推荐