Pandas数据帧选择中的多个条件

2024-04-29 03:35:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有两个相似的数据帧。具有相同结构的df1和df2。它们在一列(policyID)中有相同的数据,其他列可能有不同的数据,其中一列包含时间戳,我需要将它们分开。 df1-

policyID,statecode,county,timestamp
114455,FL,CLAY COUNTY,2015-12-23

df2-

^{pr2}$

我需要创建一个新的数据帧,比如df3,如果df1的时间戳更高,则包含来自df1的数据;如果df2的时间戳更高,则包含df2的数据。在


Tags: 数据时间结构timestampdf1df2countyfl
1条回答
网友
1楼 · 发布于 2024-04-29 03:35:10

我想您需要^{}^{},最后需要{a3}与{a4}或{a4}:

print (df1)
            0    1             2           3
0  114453   FL   CLAY COUNTY  2016-12-23
1  114455  FL1  CLAY COUNTY1  2016-12-11
2  114457  FL1  CLAY COUNTY1  2016-12-11

print (df2)
        0    1             2           3
0  114453  FL1  CLAY COUNTY1  2016-12-15
1  114455  FL1  CLAY COUNTY1  2016-12-15
2  114457  FL1  CLAY COUNTY1  2016-12-15

df1.iloc[:,3] = pd.to_datetime(df1.iloc[:,3])
df2.iloc[:,3] = pd.to_datetime(df2.iloc[:,3])

df3 = pd.concat([df1,df2])
df3 = df3.sort_values(df3.columns[3]).groupby(df3.columns[0]).first()
print (df3)
          1             2          3
0                                   
114453  FL1  CLAY COUNTY1 2016-12-15
114455  FL1  CLAY COUNTY1 2016-12-11
114457  FL1  CLAY COUNTY1 2016-12-11

^{pr2}$

相关问题 更多 >