我每天每12分钟就有一份文件清单。我应该有120个文件,但我只有114个。这意味着有6到12分钟的时间段丢失数据/文件。我创建了一个数组,左边是datetimes,右边是我的数据:
"row" -|- "Time" -|- "Rain_Rate"
1: 2014/04/02 00:00:09 | 0.5
2: 2014/04/02 00:12:20 | 1.1
3: 2014/04/02 00:24:05 | 0.48
4: 2014/04/02 00:36:51 | 2.3
5: 2014/04/02 01:00:08 | 4.1
6: 2014/04/02 01:12:26 | 5.0
7: 2014/04/02 01:24:02 | 3.2
如您所见,第4行和第5行之间缺少时间(应该是00:48:00)。我如何通过计算两边的平均降雨量来填充这一行
另外,如果有2次/行背对背丢失,我怎么做
首先,以12分钟的频率构建DateTimeIndex:
接下来,您必须使用新索引构建数据帧:
我想,您的数据是在一个带有DateTimeIndex的pd.Series
s
中,否则您必须构建一个现在,您可以使用DateTimeIndex和pandas的全部功能:
查看interpolate()了解更多选项
作为替代方案,您可以保持
Time
序列的原样,并且仅将行添加到您所描述的缺失位置,使用行之间的时间差大于12分钟作为条件。作为一种权衡,取决于你以前的现有价值观,你不会在12分钟内得到完美的结果。泛型行和下一个现有值之间的时间片来自df的输出
相关问题 更多 >
编程相关推荐