Pandas合并创造奇怪的人物

2024-04-25 10:24:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试合并两个非常简单的数据帧-每个数据帧包含6列文本。当我进行合并时,我会得到大量的记录,这些记录不会合并,因为神秘的特殊字符不会出现在最初的数据帧中,但会出现在现在合并的帧中。例如,最初两个数据帧看起来都像启动程序。但是,当我尝试执行合并时,在“right only”数据集中会有几个记录出现神秘字符。因此,它们不会合并。例如:

启动器(两个数据集)

merge_year merge_mo merge_day merge_st  merge_name    merge_county
1901       1        2         AL          BOONEY        ELMORE
1907       1        3         AL          MOVES         COVINGTON
1938       1        4         AL          JACK ROVERS   COVINGTON

合并后的数据帧#1(仅左侧)

merge_year merge_mo merge_day merge_st  merge_name    merge_county
1901       1        2         AL          BOONEY        ELMORE
1907       1        3         AL          MOVES         COVINGTON
1938       1        4         AL          JACK ROVERS   COVINGTON

合并后的数据帧#2(仅右侧)

merge_year merge_mo merge_day merge_st  merge_name      merge_county
1901       1        2         AL        — BOONEY      ELMORE 
1907       1        3         AL        — MOVES       COVINGTON 
1938       1        4         AL        JACK ROVERS     COVINGTON     

现在我得到的数据帧的形状是6,6,而它应该只有3条记录长。你知道吗

我的代码非常简单:

new_file3 = pd.merge(set1_merge, set2_merge, how='outer', validate='many_to_many', on=['merge_year','merge_mo','merge_day','merge_state','merge_name'], indicator=True)

有什么建议吗?谢谢!你知道吗


Tags: 数据name记录mergeyearmostal