我正在尝试合并两个非常简单的数据帧-每个数据帧包含6列文本。当我进行合并时,我会得到大量的记录,这些记录不会合并,因为神秘的特殊字符不会出现在最初的数据帧中,但会出现在现在合并的帧中。例如,最初两个数据帧看起来都像启动程序。但是,当我尝试执行合并时,在“right only”数据集中会有几个记录出现神秘字符。因此,它们不会合并。例如:
启动器(两个数据集)
merge_year merge_mo merge_day merge_st merge_name merge_county
1901 1 2 AL BOONEY ELMORE
1907 1 3 AL MOVES COVINGTON
1938 1 4 AL JACK ROVERS COVINGTON
合并后的数据帧#1(仅左侧)
merge_year merge_mo merge_day merge_st merge_name merge_county
1901 1 2 AL BOONEY ELMORE
1907 1 3 AL MOVES COVINGTON
1938 1 4 AL JACK ROVERS COVINGTON
合并后的数据帧#2(仅右侧)
merge_year merge_mo merge_day merge_st merge_name merge_county
1901 1 2 AL — BOONEY ELMORE 
1907 1 3 AL — MOVES COVINGTON 
1938 1 4 AL JACK ROVERS COVINGTON 
现在我得到的数据帧的形状是6,6,而它应该只有3条记录长。你知道吗
我的代码非常简单:
new_file3 = pd.merge(set1_merge, set2_merge, how='outer', validate='many_to_many', on=['merge_year','merge_mo','merge_day','merge_state','merge_name'], indicator=True)
有什么建议吗?谢谢!你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐