我有一个数据框,大约每15分钟进行80.000次观测。假设季节参数m为96,因为每24小时模式重复一次。 当我在auto_arima算法中插入这些信息时,需要很长时间(几个小时)才能发出以下错误消息:
MemoryError: Unable to allocate 5.50 GiB for an array with shape (99, 99, 75361) and data type float64
我正在使用的代码:
stepwise_fit = auto_arima(df['Hges'], seasonal=True, m=96, stepwise=True,
stationary=True, trace=True)
print(stepwise_fit.summary())
我尝试将其重新采样为每小时值,以将数据量和m因子减少到24,但我的计算机仍然无法计算结果
在处理大数据时,如何使用auto_arima找到权重因子
我记不起我读这篇文章的确切来源,但auto.arima和pmdarima都没有真正优化到可扩展性,这可能解释了您所面临的问题
但是,关于您的问题,还有一些更重要的事情需要注意:ARIMA以15分钟的间隔提供80K个数据点,无论如何,它可能不是适合您的用例的最佳模型类型:
相关问题 更多 >
编程相关推荐