如何通过查看一个数据帧中属于另一个数据帧的日期范围内的日期来组合数据帧？

2条回答

网友

1楼 · 编辑于 2024-05-29 02:57:32

考虑一种内部和外部的pandas merge方法。下面假设日期是datetime格式，可能需要从字符串对象转换：

workdf['datein'] = pd.to_datetime(workdf['datein'])
workdf['dateout'] = pd.to_datetime(workdf['dateout'])
sickdf['sickDate'] = pd.to_datetime(sickdf['sickDate'])

# INNER MERGE ON BOTH DFs WHERE SICK DAYS REPEAT FOR MATCHING EMPLOYEE ROW IN WORK DAYS
mergedf = pd.merge(workdf, sickdf, on='Employee', how="inner")

# OUTER MERGE TO KEEP ALL WORK DAY RECORDS WITH FILTERED SICK DAYS DATA SET
finaldf = pd.merge(mergedf[(mergedf['sickDate'] - mergedf['datein'] >= 0) &
                           (mergedf['dateout'] - mergedf['sickDate'] >= 0)],
                   workdf, on=['Employee', 'datein', 'dateout'], how="outer")

finaldf = finaldf.sort(['Employee','datein','dateout']).reset_index(drop=True)

结果

#    Employee     datein      dateout     sickDate   sickness
#0          1 2015-10-09   2015-10-17   2015-10-12   fatiguex
#1          1 2015-11-21   2015-11-29   2015-11-25        flu
#2          1 2015-12-21   2015-12-29   2015-12-23      other
#3          2 2015-10-27   2015-11-01          NaT        NaN
#4          2 2015-12-09   2015-12-14   2015-12-12       tanx
#5          2 2016-01-07   2016-01-12          NaT        NaN
#6          3 2015-09-28   2015-10-07   2015-10-01       rash
#7          3 2015-11-10   2015-11-19          NaT        NaN
#8          3 2015-12-10   2015-12-19          NaT        NaN
#9          4 2015-09-29   2015-10-05   2015-10-05      other
#10         4 2015-11-11   2015-11-17          NaT        NaN
#11         4 2015-12-10   2015-12-16   2015-12-13  vacationx
#12         5 2015-11-30   2015-12-08          NaT        NaN
#13         5 2015-12-30   2016-01-07   2016-01-07       eyex

网友

2楼 · 编辑于 2024-05-29 02:57:32

你需要把这些数据放到pd.DataFrame( ... )作为df1 和set_index('Employee')

；

╔══════════╦════════════╦════════════╗
║ Employee ║   datein   ║  dateout   ║
╠══════════╬════════════╬════════════╣
║        1 ║ 11/21/2015 ║ 11/29/2015 ║
║        2 ║ 12/9/2015  ║ 12/14/2015 ║
║        3 ║ 11/10/2015 ║ 11/19/2015 ║
║        4 ║ 11/11/2015 ║ 11/17/2015 ║
║        5 ║ 11/30/2015 ║ 12/8/2015  ║
║        1 ║ 12/21/2015 ║ 12/29/2015 ║
║        2 ║ 1/7/2016   ║ 1/12/2016  ║
║        3 ║ 12/10/2015 ║ 12/19/2015 ║
║        4 ║ 12/10/2015 ║ 12/16/2015 ║
║        5 ║ 12/30/2015 ║ 1/7/2016   ║
║        1 ║ 10/9/2015  ║ 10/17/2015 ║
║        2 ║ 10/27/2015 ║ 11/1/2015  ║
║        3 ║ 9/28/2015  ║ 10/7/2015  ║
║        4 ║ 9/29/2015  ║ 10/5/2015  ║
╚══════════╩════════════╩════════════╝

；

然后把这些数据放到pd.DataFrame( ... )作为df2和set_index('Employee')

；；

；

最后，df = df1.join(df2).reset_index()

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何通过查看一个数据帧中属于另一个数据帧的日期范围内的日期来组合数据帧？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >