实际的pandas
数据集如下所示:
index household carID waypoint
497 201248 2 from home 15
498 201248 2 18
499 201248 2 to home 19
500 201248 1 from home 10
501 201248 1 to home 10
502 201248 1 19
503 201248 1 to home 0
504 201248 2 from home 8
505 201248 2 9
506 201248 2 to home 9
这里你看到,carID
1
从10:00
到0:00
。所以缺席14
小时:
对于carID
2
来说,情况变得很复杂。从8:00
到9
和从15:00
到19:00
都没有
我想要的是计算CarID
2
的缺席时间:从第一次驱动from home
,08:00
,到最后一次驱动to home
19:00
。你知道吗
所以最终的数据帧应该是这样的:
index household carID waypoint absent
497 201248 2 from home 15
498 201248 2 18
499 201248 2 to home 19 4
500 201248 1 from home 10
501 201248 1 to home 10
502 201248 1 19
503 201248 1 to home 0 14
504 201248 2 from home 8
505 201248 2 9
506 201248 2 to home 9 11 (because the final end time is 19:00 see upper table)
有人有主意吗?如果我能在特定的家庭号码(而不是索引)内进行排序,这会有所帮助。你知道吗
我把你的数据框的第四栏命名为“时间”。你知道吗
缺席列返回您想要的时间。这项工作假设的逻辑,从家时间的最小值总是小于最大的到家时间。否则,您也需要按航路点分组。你知道吗
相关问题 更多 >
编程相关推荐