如何在pandas中使用日期时间索引进行插值重建?

5 投票
1 回答
1723 浏览
提问于 2025-04-18 07:09

我有一组带有日期时间索引的数据,我想用另一个任意的日期时间索引来插值这些数据。简单来说,我想知道怎么让下面这段代码大致上能工作:

from pandas import Series
import datetime

datetime_index = [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 10)]
data_series = Series([5, 15], [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 15)])

def interpolating_reindex(data_series, datetime_index):
    """?????"""

goal_series = interpolating_reindex(data_series, datetime_index) 

assert(goal_series == Series([5, 10], datetime_index))

reindex 这个方法不能满足我的需求,因为它不能进行插值,而且我的数据系列可能根本就没有相同的索引。resample 也不适合我,因为我想使用一个已经定义好的、并不一定是周期性的任意索引。我还尝试过用 Index.join 来组合索引,希望能先用 reindex 然后再插值,但结果并没有如我所预期的那样工作。有没有什么建议?

1 个回答

6

试试这个:

from pandas import Series
import datetime

datetime_index = [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 10)]
s1 = Series([5, 15], [datetime.datetime(2010, 1, 5), datetime.datetime(2010, 1, 15)])
s2 = Series(None, datetime_index)
s3 = s1.combine_first(s2)
s3.interpolate()

根据评论,插值到目标索引的结果将是:

goal_series  = s3.interpolate().reindex(datetime_index)

assert((goal_series == Series([5, 10], datetime_index)).all())

撰写回答