你如何在假期前后用可变的季节性来模拟零售销售?

2024-06-10 22:18:32 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用python中的statsmodels通过Walmart-kaggle数据集预测每周零售额。我在通过沙里玛之前很难达到平稳性。问题是复活节一年比一年间隔几周。你如何为假期的波动建模?你知道吗

我试过做一个网格搜索,寻找最好的(p,d,q)(p,d,q)m参数。我的gridsearch返回了一个SARIMA值(0,1,0)(0,2,0)52,AIC值为832,但是当绘制时,它显然是非常倾斜的(这是意料之中的,因为我的数据从来没有通过这些变换实现过平稳性)。你知道吗

有没有人对零售季节性使用SARIMAX有什么建议?我知道R包是优越的,但我不知道R,我希望我可以解决这个没有它。你知道吗

p, d, q = 0, 1, 0
P, D, Q, m = 0, 2, 0, 52

model = SARIMAX(train11.Weekly_Sales.asfreq('W-FRI'), order=(p,d,q), seasonal_order=(P,D,Q,m),
                trend='n', enforce_stationarity=False, enforce_invertibility=False)
model_fit = model.fit()
model_fit.summary()
==========================================================================================
Dep. Variable:                       Weekly_Sales   No. Observations:                  143
Model:             SARIMAX(0, 1, 0)x(0, 2, 0, 52)   Log Likelihood                -415.101
Date:                            Tue, 02 Apr 2019   AIC                            832.202
Time:                                    21:48:24   BIC                            833.813
Sample:                                02-05-2010   HQIC                           832.770
                                     - 10-26-2012                                         
Covariance Type:                              opg                                         
==============================================================================
                 coef    std err          z      P>|z|      [0.025      0.975]
------------------------------------------------------------------------------
sigma2      2.202e+08   1.77e+07     12.406      0.000    1.85e+08    2.55e+08
===================================================================================
Ljung-Box (Q):                       28.96   Jarque-Bera (JB):                77.77
Prob(Q):                              0.79   Prob(JB):                         0.00
Heteroskedasticity (H):               0.00   Skew:                            -1.44
Prob(H) (two-sided):                  0.00   Kurtosis:                         9.49
===================================================================================

Tags: 数据falsemodelorderaicfitenforcesales
1条回答
网友
1楼 · 发布于 2024-06-10 22:18:32

最简单的方法是在假期和特殊事件中使用虚拟变量。SARIMAX允许在exog中指定其他解释变量。你知道吗

如果有足够的年份来估计复活节效应,则虚拟变量可以是特定的日子,或者可以在同一虚拟变量中组合几个假日,例如圣诞节前的几个周末,此时购物比平常要高得多。你知道吗

萨里玛本身将无法捕捉像复活节这样的影响,因为即使有一年的季节性假期也不会有一个固定的周期长度。你知道吗

相关问题 更多 >