我正在做一个分类问题,在这个问题上,我试图预测一辆车是否会在第二天加油。你知道吗
数据由日期、每辆车的ID和一个虚拟变量组成,该变量指示该车是否在该特定日期加油。你知道吗
我想做的是“加油后的日子”专栏。这应该计算为自上次加油以来的天数==1,显然,必须为每个车号单独计算。如果之前没有refuelled==1的实例,则该值应等于-1。你知道吗
所需的输出应如下所示:
date car_id refuelled days_since_refuelled
01-01-2019 1 0 -1
01-01-2019 2 1 -1
01-01-2019 3 1 -1
06-01-2019 1 0 -1
06-01-2019 2 0 5
06-01-2019 3 0 5
09-01-2019 1 1 -1
09-01-2019 2 0 8
09-01-2019 3 0 8
14-01-2019 1 0 5
14-01-2019 2 1 13
14-01-2019 3 0 13
将具有} 转换为} ,然后按^{} 减去} 转换时间增量,并用^{} 替换缺少的值:
1
的行按^{NaN
,然后按ffill
转换^{date
列,最后按^{相关问题 更多 >
编程相关推荐