如何按照唯一列合并Pandas dataframe

2024-04-19 13:25:35 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个CSV文件。一个叫做“主人”_注册表.csv另一个是“主人”_参考.csv'. 这两个CSV文件都有一个名为“Master\u Id”的列。我已经从“Master”中筛选了一些值,包括“Master\u Id”_注册表.csv'并创建了名为'df'的新数据帧,我还从'Master'中筛选了一些值,包括'Master\u Id'_参考.csv'并创建了一个名为'df2'的新数据帧。所以这两个数据帧都有“Master\u Id”列。现在我想通过组合'df'和'df2'数据帧来创建新的数据帧。有人能帮我做这个吗?你知道吗

    # reading CSV from the directory
    master_registry = pd.read_csv('application/master_registry.csv')
    master_reference = pd.read_csv('application/master_registry.csv')

    # filtering some selected columns form the csv
    df = master_registry .filter(items=['Master_ID', 'Provider First Name', 'Provider Last Name (Legal Name)', 'Provider Credential Text', 'Provider Gender Code','Provider License Number State Code_1',
                    'Provider Business Practice Location Address City Name'])

    df2 = master_reference .filter(items=['Master_ID', 'Client_Reference_ID'])

Tags: 文件csv数据namemasteriddf注册表
2条回答

使用join method。用法如下-

df.set_index('Master_ID').join(df2.set_index('Master_ID'))

在我看来,您似乎想通过“主ID”合并这两个数据帧。你可以看看这个link。你知道吗

我想这应该能解决你的问题:pd.merge(df, df2, on='Master_ID')

相关问题 更多 >