基于另一个CSV中的列筛选一个CSV

2024-06-17 11:26:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个CSV文件

第一个CSV是一个小数据集,看起来像:

CSV一.CSV`

COLUMN A    COLUMN B    COLUMN C    COLUMN D    COLUMN E
    1          XYZ          A            B           D
    2          YZX.12       E            F           G
    3          ZYX.567      H            I           J 

第二个CSV是一个更大的数据集,看起来像:

CSV二.CSV

COLUMN A   COLUMN B   COLUMN C   COLUMN D   COLUMN E   COLUMN F   COLUMN G
   1        ZYX.567       A          B          D         AAA        ABB
   2        SAMPLE A      E          F          G         BBB        ACA  
   3        SAMPLE B      H          I          J         CCC        BBC 
   4        XYZ           A          B          D         ABA        BBA
   5        SAMPLE C      E          F          G         ABC        BAB
   6        YZX.12        H          I          J         CCA        CAC

我希望我的输出是CSV-TWO,但只有CSV-ONE的B列:

COLUMN A   COLUMN B   COLUMN C   COLUMN D   COLUMN E   COLUMN F   COLUMN G
   1        ZYX.567       A          B          D         AAA        ABB
   4        XYZ           A          B          D         ABA        BBA
   6        YZX.12        H          I          J         CCA        CAC

我正在使用熊猫数据帧。。。如果您能提供任何帮助,我们将不胜感激。谢谢你


Tags: 文件csv数据samplecolumnbbbcccxyz
1条回答
网友
1楼 · 发布于 2024-06-17 11:26:00

这是一个merge问题,只从您的右数据框中选择相关的列

df_merged = pd.merge(df1, df2[['COLUMN B', 'COLUMN F', 'COLUMN G']], on='COLUMN B', how='inner')

print(df_merged)
   COLUMN A COLUMN B COLUMN C COLUMN D COLUMN E COLUMN F COLUMN G
0         1      XYZ        A        B        D      ABA      BBA
1         2   YZX.12        E        F        G      CCA      CAC
2         3  ZYX.567        H        I        J      AAA      ABB

相关问题 更多 >