我和ARIMA一起工作。为了使数据保持平稳,我使用log转换数据,然后使用shift减去值。当我用滚动平均值和adfuller测试再次测试时。我得到的p值是0.0000为什么是这样
我的代码:
import numpy as np
import pandas as pd
from statsmodels.tsa.stattools import adfuller
import matplotlib.pyplot as plt
df =
Date open high low close adjclose Volume
2010-06-30 5.158000 6.084000 4.660000 4.766000 4.766000 85935500
2010-07-01 5.000000 5.184000 4.054000 4.392000 4.392000 41094000
df['Date']=pd.to_datetime(df['Date'], infer_datetime_format=True)
df=df.set_index(['Date'])
def test_ad(values):
mvm = values.rolling(window=12).mean()
mvstd = values.rolling(window=12).std()
orig = plt.plot(values,color='blue',label='org')
mean = plt.plot(mvm,color='red',label='mvm')
std=plt.plot(mvstd,color='black',label='mvstd')
plt.legend(loc='best')
plt.show(block=False)
result=adfuller(values)
print('ADF Statistic: %f' % result[0])
print('p-value: %f' % result[1])
print('Critical Values:')
#labels = ['ADF Test Statistic','p-value','#Lags Used','Number of Observations Used']
for key, value in result[4].items():
print('\t%s: %.3f' % (key, value))
if result[1] <= 0.05:
print("Data is stationary")
else:
print("non-stationary ")
test_ad(df['Close'])
其中:
ADF Statistic: 6.450459
p-value: 1.000000
Critical Values:
1%: -3.433
5%: -2.863
10%: -2.567
df['log']=np.log(df["Close"])
df['close']=df['log']-df['log'].shift()
#df['close']=df['log'].diff()
test_ad(df['close'].dropna())
给
ADF Statistic: -50.361617
p-value: 0.000000
Critical Values:
1%: -3.433
5%: -2.863
10%: -2.567
该图看起来是静止的,正如上面所示,临界值也得到了满足
你可以看到你的ADF统计值远小于临界值1%,因此你的p非常小
让人困惑的是,您正在使用
%f
打印此值,默认情况下(即未指定精度,例如%.2f
包含2个小数或%.10f
包含10个小数)仅在点后包含6个小数如果要完整地打印值(例如
print('p-value: %s' % result[1])
,将p值视为字符串(因此无需指定精度),或者在f字符串print(f'p-value: {result[1]}')
中打印,您会看到p值实际上大于0(尽管仍然非常小)相关问题 更多 >
编程相关推荐