如何在pandas中使用日期时间索引进行插值重建?
我有一组带有日期时间索引的数据,我想用另一个任意的日期时间索引来插值这些数据。简单来说,我想知道怎么让下面这段代码大致上能工作:
from pandas import Series
import datetime
datetime_index = [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 10)]
data_series = Series([5, 15], [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 15)])
def interpolating_reindex(data_series, datetime_index):
"""?????"""
goal_series = interpolating_reindex(data_series, datetime_index)
assert(goal_series == Series([5, 10], datetime_index))
reindex
这个方法不能满足我的需求,因为它不能进行插值,而且我的数据系列可能根本就没有相同的索引。resample
也不适合我,因为我想使用一个已经定义好的、并不一定是周期性的任意索引。我还尝试过用 Index.join
来组合索引,希望能先用 reindex
然后再插值,但结果并没有如我所预期的那样工作。有没有什么建议?
1 个回答
6
试试这个:
from pandas import Series
import datetime
datetime_index = [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 10)]
s1 = Series([5, 15], [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 15)])
s2 = Series(None, datetime_index)
s3 = s1.combine_first(s2)
s3.interpolate()
根据评论,插值到目标索引的结果将是:
goal_series = s3.interpolate().reindex(datetime_index)
assert((goal_series == Series([5, 10], datetime_index)).all())