こんにちは。 本日から時系列解析について触れていきます。今回は用語の説明と基本的なモデルであるARとMAを使ってみます そもそも時系列なデータとはなんだ? 答えは簡単、時間とともに変化するデータのこと. 例えば、気温とか為替とか。。。

時系列データ

{y_t}<em>{t=1}^Tを時系列データとします 時系列データでは、y_ty</em>{t-j}は相関しているかもしれない そのような相関を系列相関あるいは自己相関という、y_{t-j}y_tj次のラグという 次に時系列解析で非常に重要なキーワードである定常性についてです

定常性

  • 時間よって変化しない時系列の性質のこと
特に、定常な時系列においては、 – \mathbb{E}(y_t) = \muvar(y_t) = \gamma_<em>0COV(y_t, y</em>{t-j}) = gamma_j なお、gamma_jj次の自己共分散という 平均と自己共分散がtに依存していない場合は、弱定常という 定常なら弱定常であるが、逆は必ずしも成り立たない。 また弱定常で、平均01次以上の自己共分散が0な時系列をホワイトノイズという しかしあいにく、現実世界は定常性などほぼない、 定常性が満たされない例で、経済学上重要なものは、 – トレンドがある場合 – 確率的トレンドがある場合 – 構造変化がある場合 定常性がない時系列を非定常時系列という

自己共分散と自己相関係数

  • 自己共分散と自己相関係数は変数の系列相関を表現する基本的なパラメーター
j次の自己共分散は、gamma_<em>j = cov(y_t, y</em>{t-j}) j次の自己相関係数は、

    \[\rho_{j}=\frac{\operatorname{Cov}\left(y_{t}, y_{t-j}\right)}{\sqrt{\operatorname{var}\left(y_{t}\right)} \sqrt{\operatorname{var}\left(y_{t-j}\right)}}=\frac{\gamma_{j}}{\gamma_{0}}\]

時系列解析をするときはまず自己相関を調べよう 横軸にjをとり、縦軸にρ_jをとるグラフをピリオドグラム(コレログラム)という これについては下のコード見てください

いざ、モデルへ

ある程度の基本用語は上で解説した通り、 次はモデルを数式から見ていきましょう、実装を見たい方はその下のコードへどうぞ

Auto Regression

AR(p)モデルは、

    \[y_{t}=\alpha_{0}+\alpha_{1} y_{t-1}+\ldots, + \alpha_{p} y_{t-p}+\epsilon_{t}\]

で表されます ここで、\alpha_iはパラメーターであり、\epsilon_t \sim i.i.d.(0, \sigma^2)です i.i.d.は独立同分布って意味です。つまりこのモデルは過去の自分に依存するモデルです AR(p)モデルに従うy_tの期待値は、

    \[\begin{aligned} E\left[y_{t}\right] &=\alpha_{0}+\alpha_{1} E\left[y_{t}\right]+\alpha_{2} E\left[y_{t}\right]+\cdots+\alpha_{p} E\left[y_{t}\right] \ &=\frac{\alpha_{0}}{1-\alpha_{1}-\alpha_{2}-\cdots-\alpha_{p}} \end{aligned}\]

であり、分散は

    \[V\left[y_{t}\right]=\frac{\sigma^{2}}{1-\alpha_{1}^{2}-\alpha_{2}^{2}-\cdots-\alpha_{p}^{2}}\]

となります。なおこれは、分散均一を仮定している回帰モデルです このARモデルと定常性の関係を見ましょう
  • 定常性の条件
ARモデルで表現できる時系列が定常性を持つための条件は、

    \[1-\alpha_{1} x-\alpha_{2} x^{2}-\cdots-\alpha_{p} x^{p}=0\]

という方程式の解の絶対値がすべて 1 より大きいことです。AR(1) の場合、定常性の条件は、

    \[|\alpha_1| < 1\]

で、AR(2) の場合は、

    \[ \alpha_{1}+\alpha_{2}< 1, \alpha_{2}-\alpha_{1}< 1,-1 <\alpha_{2}< 1\]

一般のAR(p)モデルの場合に定常性の条件を求めることも可能ですがその条件はかなり複雑な式になりますね、、、 ところで、モデルのパラメータはどうやって決めるのでしょうか?
  • モデル選択(パラメータ選択)
ARモデルを当てはめる方法としては、 1. ユールウォーカー (Yule-Walker) 法 2. 最小2乗法 3. 最尤法 4. Burg 法 など幾つかの方法が提案されているようです。 また、モデルの評価、言い換えるとモデルの良さの判断材料はAIC、BIC などの情報量規準が多く用いられてます

Moving Average

株とかfxに興味ある人なら知っていると思いますが 単純移動平均線ってありますよね。あのことです。 MA(q)モデルは

    \[y_{t}=\theta_{0}+\epsilon_{t}-\theta_{1} \epsilon_{t-1}-\cdots-\theta_{q} \epsilon_{t-q}\]

ただし、\epsilon_t \sim i.i.d.(0, \sigma^2) MA(q)モデルに従うy_tの期待値は、

    \[\mu=E\left(y_{t}\right)=E\left(\theta_{0}+\epsilon_{t}-\theta_{1} \epsilon_{t-1}-\ldots \theta_{q} \epsilon_{t-q}\right)=\theta_{0}\]

であり、分散は

    \[\gamma_{0}=E\left(y_{t}^{2}\right)-\mu^{2}=E\left(\epsilon_{t}^{2}\right)+\theta_{1}^{2} E\left(\epsilon_{t-1}^{2}\right)+\ldots \theta_{q} E\left(\epsilon_{t-q}^{2}\right)=\left(1+\theta_{1}^{2}+\cdots+\theta_{q}^{2}\right) \sigma^{2}\]

グタグタと数式を書きましたが、あまり気にしなくてもいいです 最後にコードを載せますが、はじめはメモのようになっており、 後半からはARとMAのを使ってます。
次回は為替データにでも適応してみようかな。 でわ

READMORE