将\u个重复项放入

ssno nm_emp_lst nm_emp_fst apnt_ymd 299769 123456789 GREENE ALTON 2014-05-04 192323 123456789 GREENE ALTON 2013-04-07 192324 123456789 GREENE ALTON 2012-04-08 192324 123456789 GREENE ALTON 2012-04-08 102872 123456789 GREENE ALTON 2011-04-10 175701 987654321 DUBE JEFF 2013-04-21 177583 777888999 IRVING SARA 2013-05-13 4785 777888999 IRVING SARA 2012-05-16 222300 444444444 LEMERE GEORGE 2013-04-14 24386 444444444 LEMERE GEORGE 2012-03-25 24434 444444444 LEMERE GEORGE 2011-05-08

1条回答

网友

1楼 · 发布于 2024-05-16 18:28:39

如果我理解正确，那么您可以在dataframe上使用^{}，传递要检查重复项的列的列表：

In [31]:

df.drop_duplicates(['nm_emp_lst','apnt_ymd'])
Out[31]:
        id       ssno nm_emp_lst nm_emp_fst    apnt_ymd
0   299769  123456789     GREENE      ALTON  2014-05-04
1   192323  123456789     GREENE      ALTON  2013-04-07
2   192324  123456789     GREENE      ALTON  2012-04-08
4   102872  123456789     GREENE      ALTON  2011-04-10
5   175701  987654321       DUBE       JEFF  2013-04-21
6   177583  777888999     IRVING       SARA  2013-05-13
7     4785  777888999     IRVING       SARA  2012-05-16
8   222300  444444444     LEMERE     GEORGE  2013-04-14
9    24386  444444444     LEMERE     GEORGE  2012-03-25
10   24434  444444444     LEMERE     GEORGE  2011-05-08

编辑根据我们的私人聊天，以下是您想要的：

In [89]:

df.drop_duplicates(['ssno','apnt_ymd'])
Out[89]:
        id       ssno nm_emp_lst nm_emp_fst    apnt_ymd
0   299769  123456789     GREENE      ALTON  2014-05-04
1   192323  123456789     GREENE      ALTON  2013-04-07
2   192324  123456789     GREENE      ALTON  2012-04-08
4   102872  123456789     GREENE      ALTON  2011-04-10
5   175701  987654321       DUBE       JEFF  2013-04-21
6   177583  777888999     IRVING       SARA  2013-05-13
7     4785  777888999     IRVING       SARA  2012-05-16
8   222300  444444444     LEMERE     GEORGE  2013-04-14
9    24386  444444444     LEMERE     GEORGE  2012-03-25
10   24434  444444444     LEMERE     GEORGE  2011-05-08

相关问题更多 >

编程相关推荐

热门问题

热门文章