下面是我想要的输入/输出。我有一些想法,但不完全确定。。你知道吗
How do i detect duplicates and then among them cross check if two columns have similar values?
所以我有一个这样的数据框。你知道吗
No fname sname landline address time_of_move_in
1 Alphred Thomas 123 A 19/10/2016,00:01:00
2 Peter Jay 345 B 29/10/2016,00:01:00
3 Donald Hook 123 A 30/10/2016,00:11:00
4 Jay Donald 345 B 29/10/2016,00:05:00
5 Jay Donald 123 A 30/10/2016,00:14:00
6 Haskell Peter 123 B 19/10/2016,00:01:00
我想要的是这样的输出
Case_Number fname sname landline address time_diff
1 Peter Jay 345 B -4 Hours
1 Jay Donald 345 B 4 Hours
2 Donald Hook 123 A -2 Hours
2 Jay Donald 123 A 2 Hours
最后,我只想过滤掉发现的两个时间差为<;3小时的任何情况。你知道吗
任何两个病例之间的标准
固定电话和地址应相同
如果上述为真,则在检测到的两行之间的fname或姓氏中必须重复相同的名称。(在上面的案例1中是Jay,在上面的案例2中是Donald。注意:如果Donald在fname中重复两次,则这是无效的情况)
两个小时之间的时差<;3小时,我想把时间的方向性也带到这里,因此在上面的输出中设置了负片。
注:我们不必以上述格式显示时差。只要是数字/时间格式就行
您可以将timedelta转换为^{} ,因为使用
timedelta < 0
有点复杂:相关问题 更多 >
编程相关推荐