我正在为这个功能寻找一个更快的替代方案:
def add_weather_data(data, weather):
w = pd.DataFrame()
for date in data.date:
w = w.append(weather.iloc[weather.index.get_loc(date, method='nearest')])
return pd.concat([data, w.set_index(data.index)], axis=1)
具体来说,我有两个数据帧:data
包含我的数据集以及一个名为date
的列,其中填充了pd.Timestamp
,而weather
包含用DatetimeIndex
索引的数据。对于data
中的每一行,我希望搜索距离weather
中data.date
最近的索引,并将weather
中的那一行附加到data
中的这一行(丢弃weather
中的DatetimeIndex
)。你知道吗
有没有一个更好的替代我的上述职能?我的方法似乎要花很长时间。。。谢谢!你知道吗
简单的joining表格怎么样?你知道吗
但看起来你想要最近的约会。可以创建一个包含所有日期的表,并使用Pandas
interpolate
函数来填充缺少的值。然后把它连接到原始数据帧?你知道吗将^{} 与
method='nearest'
一起使用考虑示例数据帧
data
和weather
那么
回复评论
相关问题 更多 >
编程相关推荐