SARIMAX (seasonal autoregressive integrated moving average with exogenous regressor)是一种常见的时间序列预测方法,可以分为趋势部分和周期性部分;每个部分又可以分为自回归、差分和平滑部分。
趋势稳定性检测:Kwiatkowski–Phillips–Schmidt–Shin (KPSS) test
null-hypothesis: 时间序列趋势稳定。significance: 0.05. 选择KPSS和不是Dickey Fuller由于KPSS的null-hypothesis是趋势稳定,所以接受条件相对于Dickey Fuller更宽松,差分阶数更少。
y t = β ′ D t + μ t + u t y_t = beta^{prime} D_t + mu_t + u_t yt=β′Dt+μt+ut
μ t = μ t − 1 + ϵ t , mu_t = mu_{t-1} + epsilon_t, μt=μt−1+ϵt,
ϵ t ∼ W N ( 0 , σ ϵ 2 ) epsilon_t sim WN(0, sigma^2_epsilon) ϵt∼WN(0,σϵ2)
其中D为确定时间序列趋势/常数。u为随机漫步。epsilon为残差。
LM statistic:
K P S S = ( T − 2 ∑ t = 1 T S ^ t 2 ) / λ ^ 2 KPSS = (T^-2 sum_{t=1}^{T} hat S_t^2) / hatlambda^2 KPSS=(T−2∑t=1TS^t2)/λ^2
其中 S ^ t = ∑ j = 1 t u ^ j hat S_t = sum_{j=1}^{t} hat u_j S^t=∑j=1tu^j
u ^ hat{u} u^ 是yt 拟合Dt的残差,$ hat lambda^2$ 是var(ut)的预估值。问题归结为拉格朗日乘数法证明 σ ϵ 2 = 0 sigma^2_epsilon = 0 σϵ2=0
季节稳定性检测:Canova-Hansen方法
null-hypothesis: 时间序列季节稳定性。significance: 0.05
测试频率:给定待测最大频率m以下所有 2pi/m整数倍。
时间序列yi的拟合:
y i = μ + x i ′ β + S i + e i y_i = mu + x^{prime}_i beta + S_i + e_i yi=μ+xi′β+Si+ei
S i = ∑ j = 1 m / 2 f j i ′ γ j S_i = sum_{j=1}^{m/2} f^{prime}_{ji} gamma_j Si=∑j=1m/2fji′γj
其中
f j i ′ = ( c o s ( ( j / q ) π i ) , s i n ( ( j / q ) π i ) ) f^{prime}_{ji} = (cos((j/q) pi i), sin((j/q) pi i)) fji′=(cos((j/q)πi),sin((j/q)πi))
LM statistic:
L M = 1 n 2 t r a c e ( ( Ω ^ f ) − 1 ∑ i = 1 n F ^ i F ^ i ′ ) LM = frac{1}{n^2} trace( (hat Omega ^f)^-1 sum_{i=1}^{n} hat F_i hat F^{prime}_i) LM=n21trace((Ω^f)−1i=1∑nF^iF^i′)
其中
F ^ i = ∑ t = 1 i f t e ^ t hat F_i = sum_{t=1}^{i}f_t hat e_t F^i=∑t=1ifte^t
Ω ^ f = ∑ k = − m m w ( k m ) 1 n ∑ i f i + k e ^ i + k f i ′ e ^ i