ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【時系列解析の基礎】「弱定常性」「線形性」「ガウス性」は同じ?似ている?それとも別物?

時系列解析の入門書や講義、あるいは時系列解析に関連した論文では、弱定常性(weak stationarity)線形性(linearity)ガウス性(Gaussianity)といった言葉が頻繁に登場します。しかし、時系列解析の応用がさまざまな分野へと広がるにつれて、これらの用語が指す意味は、曖昧に、あるいは不正確に、ときには誤って用いられる場面も増えてきたように感じられます。
 そこで本記事では、弱定常性(weak stationarity)線形性(linearity)ガウス性(Gaussianity)の意味をあらためて確認したうえで、

  • これらは同じ意味なのか?
  • どれか一つを仮定すれば、他も自動的に成り立つのか?
  • なぜこれらはいつもセットで語られるのか?

といった疑問について考えてみたいと思います。
 結論から言えば、これらの3つは、異なる概念です。ただし、特定の条件下ではお互いが強く関連するため、その違いが意識されないまま混同されることが少なくありません。

「弱定常性」「線形性」「ガウス性」の違い

1. 弱定常性(weak stationarity)とは何か

まず、弱定常性を数式で定義しておきます。時系列 \{X_t\} が弱定常であるとは、任意の時刻 t とラグ \tau に対して、次の条件が成り立つことを意味します。

\displaystyle{
\begin{aligned}
\mathbb{E}[X_t] &= \mu \\
\mathrm{Var}(X_t) &= \sigma^2 \\
\mathrm{Cov}(X_t, X_{t+\tau}) &= C(\tau)
\end{aligned}
}

すなわち、平均 \mu、分散 \sigma^ 2、自己相関(自己共分散)が、時間シフトに対して不変ということです。そして、自己相関(自己共分散)については、それが2 点の時間差 \tau のみの関数になるということです。
 ここで注意したいことは、確率分布そのものが時間不変であることまでは要求していない点です。弱定常性で固定されているのは、あくまで、「平均」「分散」「自己相関」に限られます。その他の特性は変化しても構わないので、正規分布に従わない非ガウス過程(ガウス性がない過程)でも弱定常ということはあり得ます。

2. 線形性(linearity)とは何か

 線形性とは、現在の値が、過去に生じたランダムな擾乱(ノイズ)の加算平均として生成されるということです。この定義を数式を使って説明すると、時系列  \{X_t\} は、移動平均モデル(Moving Average model:MA)として、次のように表されます。

\displaystyle{
X_t = \sum_{k=0}^{\infty} a_k \,\varepsilon_{t-k}
}

ここで、\{\varepsilon _ t\}白色ノイズ(white noise) と呼ばれる確率過程であり、[tex: \{a_k\}) は過去の擾乱が現在の値にどれだけ影響するかを表す係数です。
 この定義のもとでは、自己回帰モデル(AR: Autoregressive model)や 自己回帰移動平均モデル(ARMA)も、線形過程に自然に含まれます。なぜなら、AR 過程は無限次の MA 仮定として書き換えられるからです(ARMAも同様)。

■ 白色ノイズと白色性

 多くの場合、白色ノイズには次のような性質があります。

  • 平均が0
\displaystyle{
\mathbb{E}[\varepsilon_t] = 0
}
  • 分散が一定
\displaystyle{
\mathrm{Var}(\varepsilon_t) = \sigma_\varepsilon^2 < \infty
}
  • 無相関
\displaystyle{
\mathrm{Cov}(\varepsilon_t,\varepsilon_s)
= \mathbb{E}[\varepsilon_t \varepsilon_s]
= 0 \qquad (t \neq s)
}

最後の無相関である特性を持つことが、本質的な 白色性 の定義です。
 ここで注意してほしいことは、ノイズが正規分布に従う(ガウス性がある)必要はないという点です。正規分布を仮定する場合には「ガウス白色ノイズ(Gaussian white noise)」と呼ばれますが、線形過程の一般的な定義自体は 非ガウスノイズでも成立します。

■ ランダムウォークは非定常なのに線形

 線形過程とは、その過程がMA過程

\displaystyle{
X_t = \sum_{k=0}^{\infty} a_k \,\varepsilon_{t-k}
}

として書けるということでした。ここで、[tex: \{\varepsilon_t\}) は平均 0、有限分散をもつ白色ノイズであり、正規性は仮定されません。
 このMA過程の係数を

\displaystyle{
a_k = 1 \quad (k=0,1,2,\dots)
}

とすると、

\displaystyle{
X_t
= \varepsilon_t + \varepsilon_{t-1} + \varepsilon_{t-2} + \cdots
}

となります。初期値 X _ 0=0 とすれば、これは

\displaystyle{
X_t = \sum_{j=1}^{t} \varepsilon_j
}

と書き直せます。これは、ランダムウォーク過程と呼ばれるもので、その連続時間版が「ブラウン運動」 です。
 ランダムウォーク過程は

  • 非線形項を一切含まず
  • 過去のノイズを単純に足し合わせる

という意味で、完全に線形な生成規則をもっています。ここで注意してほしいことは、ランダムウォーク過程線形ですが、弱定常ではないということです。
 ランダムウォーク過程の平均と分散(実際は存在しない)を計算してみると、ノイズが \displaystyle{
\mathbb{E}[\varepsilon _ t]=0
} であるので、平均は

\displaystyle{
\mathbb{E}[X_t]=0
}

です。
 次に、分散を計算してみると、

\displaystyle{
\mathrm{Var}(X_t)
= \mathrm{Var}\!\left(\sum_{j=1}^{t} \varepsilon_j\right)
= \sum_{j=1}^{t} \mathrm{Var}(\varepsilon_j)
= t\,\sigma_\varepsilon^2
}

となり、 t \to \infty で、分散は無限に発散します。これは、

  • 分散が時間によらず一定

という弱定常性の条件を、明確に破っています。
 したがって、「ランダムウォークは線形過程であるが、弱定常ではない」という結論が導かれます。

■ ブラウン運動・非整数ブラウン運動は「非線形」なのか?

 ここで、よく見かける誤解について触れておきたいです。文献によっては、

  • ブラウン運動(Brownian motion)
  • 非整数ブラウン運動(fractional Brownian motion, fBm)

「非線形過程」 と説明しているものがありますが、これは定義の混同に基づく誤りです。  ブラウン運動は、ランダムウォークの連続時間極限であり、

  • 独立な微小擾乱の加算
  • 非線形な生成項を含まない

という意味で、本質的に線形な過程です。
 同様に、非整数ブラウン運動も、

  • ガウス過程であり
  • 過去のガウスノイズの線形汎関数として構成できる

という点で、非線形過程ではありません。これらがしばしば「非線形」と誤って呼ばれる理由は、

  • 非定常である
  • 増分が長期相関をもつ
  • スケーリング指数が非整数である

といった性質が、なんとなく「複雑そう」なので、「非線形っぽく」感じられるということだと思います。しかし、非整数ブラウン運動あ非線形性過程という説明は間違いです

3. ガウス性(Gaussianity)とは何か

ガウス性とは、時系列が従う確率分布の形に関する性質です。具体的には、時系列\{X_t\} に対して、

  • 各時刻 t における確率変数 X _ t が正規分布に従う
  • あるいは、任意の有限個の時刻  (t _ 1, t _ 2, \cdots, t _ n) に対して [tex: (X _ {t _ 1}, X _ {t _ 2}, \cdots, X _ {t _ n})) が 多変量正規分布 に従う

とき、その時系列は ガウス過程(Gaussian process) と呼ばれます。
 ここで重要なのは、ガウス性は分布の形だけを説明しているのであり、線形性や定常性とは別の概念という点です。

■ ガウス過程の性質

 ガウス過程の重要な特徴(都合の良い性質)は、次の事実にあります。

ガウス過程では、平均関数と自己相関(自己共分散)関数が与えられれば、 過程の有限次元分布がすべて一意に定まる

このため、ガウス過程では、

  • 自己相関関数
  • パワースペクトル

といった 2 次統計量が、分布そのものを記述する役割を担います。これは、非ガウス過程では一般に成り立たない、都合の良い性質です。

 このことを踏まえて、ガウス性と定常性との関係について重要な事実を一つ挙げておきます。

弱定常性をもつガウス過程は強定常過程

理由は明確で、ガウス過程では分布が

  • 平均
  • 共分散

だけで完全に決まるためです。したがって、平均が時間に依存せず、共分散がラグだけで決まるならば、分布全体も時間に依存しなくなります

■ 白色性とガウス性の混同について

 ここで、初学者だけでなく、研究の現場でもしばしば見られる典型的な混同について触れておきます。
 白色性とは、無相関であるということです。一方、ガウス性は分布の形に関する概念です。この 2 つは本来まったく別物ですが、

  • 白色ガウスノイズ(Gaussian white noise)

という用語が存在するため、「ガウスノイズ」と言って、無相関であると説明したり、「白色ノイズ」と言って、正規分布に従うと説明したり、「えっ何」という説明を耳にすることが結構あります。  白色性は「無相関かどうか」の話であり、ガウス性は「どの分布に従うか」の話です。 この二つを混同しないように注意してください。

まとめ

 今回は、時系列解析で頻繁に登場する 弱定常性・線形性・ガウス性 という三つの概念について説明しました。これらを簡潔に整理すると、次のようにまとめられます。

  • 弱定常性は「結果の性質」  平均、分散、自己相関(自己共分散)が時間に依存しないという意味で、2 次統計量の特徴づけに関わる概念です。
  • 線形性は「生成規則の構造」  現在の値が過去の値や擾乱の線形結合として表され、線形な差分方程式や移動平均過程として記述できることを指します。
  • ガウス性は「分布の形」  確率変数が正規分布(多変量正規分布)に従うという性質です。

意外に感じるかもしれませんが、弱定常性や線形性を仮定しても、ガウス性は必ずしも仮定されていません。したがって、弱定常過程や線形過程であっても、分布が非ガウスであることは十分にあり得ます。そのような非ガウス過程は、弱定常性や線形性の枠組みの外から非ガウス性を追加で解析しないと、その過程を十分に特徴づけることはできません。
 また、白色性は「無相関であること」を意味する概念であり、正規分布に従うかどうかとは別の話であることも強調しました。
 科学的な議論に限らず、どのような議論であっても、用語の定義が共有されていなければ、正確な意思疎通は成り立ちません。とくに時系列解析のように前提条件が重要な分野では、用語の意味を正確に理解すること自体が解析の一部だと言えます。そして何より、科学の用語は必要があって導入されたものです。その背景や定義を丁寧にたどることで、形式的な理解にとどまらず、現象そのものへの理解もより深まっていくはずです。

※ もし記事の中で「ここ違うよ」という点や気になるところがあれば、気軽に指摘していただけると助かります。質問や「このテーマも取り上げてほしい」といったリクエストも大歓迎です。必ず対応するとは約束できませんが、できるだけ今後の記事で扱いたいと思います。それと、下のはてなブログランキングはあまり信用できる指標ではなさそうですが (私のブログを読んでいる人は、実際とても少ないです)、押してもらえるとシンプルに励みになります。気が向いたときにポチッとしていただけたら嬉しいです。

【付録】演習:安定な自己回帰過程AR(1)が弱定常であることを確認

 1 次の自己回帰過程(AR(1))を考えます。

\displaystyle{
X_t = \phi X_{t-1} + \varepsilon_t
}

ここで、

  •  \{\varepsilon_t\}:平均 0、分散  \sigma^ 2 _ \varepsilon の白色ノイズ
  • \phi:定数

を仮定し、安定条件

\displaystyle{
|\phi| < 1
}

が満たされる場合を考えます。

■ 平均が一定になることの確認

 期待値を取ると、

\displaystyle{
\mathbb{E}[X_t]
= \phi \mathbb{E}[X_{t-1}] + \mathbb{E}[\varepsilon_t]
= \phi \mathbb{E}[X_{t-1}]
}

ここで \displaystyle{
\mathbb{E}[\varepsilon _ t]=0
} なので、

\displaystyle{
\mathbb{E}[X_t] = \phi \mathbb{E}[X_{t-1}]
}

が成り立ちます。もし定常な平均  \mu = \mathbb{E}[X_t] が存在するとすれば、

\displaystyle{
\mu = \phi \mu
}

となり、\displaystyle{
|\phi|\lt1
} のもとでは

\displaystyle{
\mu = 0
}

しかあり得ません。つまり、平均は時間によらず一定(つまり、0)になります。

■ 分散が一定になることの確認

 次に分散を計算します。

\displaystyle{
\begin{aligned}
\mathrm{Var}(X_t)
&= \mathrm{Var}(\phi X_{t-1} + \varepsilon_t) \\
&= \phi^2 \mathrm{Var}(X_{t-1}) + \mathrm{Var}(\varepsilon_t)
\end{aligned}
}

ここで、\displaystyle{
X _ {t-1}
} と その後の値  \varepsilon _ t は無相関であることを使いました。
 定常分散を \displaystyle{
\sigma _ X^ 2
} とすると、

\displaystyle{
\sigma_X^2
= \phi^2 \sigma_X^2 + \sigma_\varepsilon^2
}

これを解くと、

\displaystyle{
\sigma_X^2
= \frac{\sigma_\varepsilon^2}{1-\phi^2}
}

となります。つまり、\displaystyle{
|\phi| \lt 1
} のときに限って分散が有限な値として定ります。

■ 自己相関がラグだけで決まること

 自己共分散を

\displaystyle{
\gamma(\tau):=\mathrm{Cov}(X_t,X_{t-\tau})
\qquad (\tau\ge 0)
}

と定義します。前節より \displaystyle{
\mathbb{E}[X _ t]=0
} なので、

\displaystyle{
\gamma(\tau)
=\mathbb{E}[X_tX_{t-\tau}]
\qquad (\tau\ge 0)
}

と書けます。
 ラグ 1 のときの自己共分散 \displaystyle{
\gamma(1)
} を計算するために、

\displaystyle{
\gamma(1)=\mathbb{E}[X_tX_{t-1}]
}

に、モデル式 \displaystyle{
X _ t=\phi X _ {t-1}+\varepsilon _ t
} を代入します。

\displaystyle{
\begin{aligned}
\gamma(1)
&=\mathbb{E}\big[(\phi X_{t-1}+\varepsilon_t)X_{t-1}\big] \\
&=\mathbb{E}\big[\phi X_{t-1}^2+\varepsilon_tX_{t-1}\big] \\
&=\phi,\mathbb{E}[X_{t-1}^2]+\mathbb{E}[\varepsilon_tX_{t-1}]
\end{aligned}
}

ここで \displaystyle{
X _ {t-1}
}t-1 までのノイズ \displaystyle{
\varepsilon _ {t-1}, \varepsilon _ {t-2}, \cdots
} のみから決まるのに対し、\displaystyle{
\varepsilon _ t
} は時刻 t の新しいノイズなので、白色ノイズの仮定より

\displaystyle{
\mathbb{E}[\varepsilon_t\, X_{t-1}]=0
}

です。したがって

\displaystyle{
\gamma(1)=\phi\,\mathbb{E}[X_{t-1}^2]
}

定常状態では \displaystyle{
\mathbb{E}[X _ {t-1}^ 2]=\mathbb{E}[X _ t^ 2]=\gamma(0)
} なので

\displaystyle{
\gamma(1)=\phi\, \gamma(0)
}

が得られます。

 一般のラグ \displaystyle{
\tau\ge 1
} の場合、

\displaystyle{
\gamma(\tau)=\mathbb{E}[X_tX_{t-\tau}]
\qquad (\tau\ge 1)
}

について同様に代入します。

\displaystyle{
\begin{aligned}
\gamma(\tau)
&=\mathbb{E}\big[(\phi X_{t-1}+\varepsilon_t)X_{t-\tau}\big] \\
&=\phi,\mathbb{E}[X_{t-1}X_{t-\tau}] + \mathbb{E}[\varepsilon_tX_{t-\tau}]
\end{aligned}
}

ここで \displaystyle{
\tau\ge 1
} なら \displaystyle{
t-\tau\le t-1
} なので、\displaystyle{
X _ {t-\tau}
} は時刻 t より前の情報(\displaystyle{
(\varepsilon _ {t-\tau},\varepsilon _ {t-\tau-1},\dots)
})のみから決まります。したがって白色ノイズの仮定より

\displaystyle{
\mathbb{E}[\varepsilon_t  \, X_{t-\tau}]=0
}

となります。よって

\displaystyle{
\gamma(\tau)=\phi\,\mathbb{E}[X_{t-1}X_{t-\tau}]
}

右辺はラグ \displaystyle{
\tau-1
} の自己共分散に一致します。実際、

\displaystyle{
\mathbb{E}[X_{t-1}X_{t-\tau}]
=\mathbb{E}[X_{t-1}X_{(t-1)-(\tau-1)}]
=\gamma(\tau-1)
}

なので、

\displaystyle{
\gamma(\tau)=\phi\,\gamma(\tau-1)\qquad(\tau\ge 1)
}

という漸化式が得られます。
 上の関係を繰り返し用いると、

\displaystyle{
\begin{aligned}
\gamma(1)&=\phi,\gamma(0)\\
\gamma(2)&=\phi,\gamma(1)=\phi^2\gamma(0)\\
\gamma(3)&=\phi,\gamma(2)=\phi^3\gamma(0)\\
&\ \vdots \\
\gamma(\tau)&=\phi^\tau\gamma(0)
\end{aligned}
}

したがって

\displaystyle{
\gamma(\tau)=\phi^\tau,\gamma(0)\qquad(\tau=0,1,2,\dots)
}

が得られます。  負のラグの場合については、共分散の対称性 (\displaystyle{
\mathrm{Cov}(A,B)=\mathrm{Cov}(B,A)
}) より、

\displaystyle{
\gamma(-\tau)=\gamma(\tau)
}

したがって

\displaystyle{
\gamma(\tau)=\gamma(0)\,\phi^{|\tau|}\qquad(\tau\in\mathbb{Z})
}

 以上から、自己相関関数 \displaystyle{
\rho(\tau)=\gamma(\tau)/\gamma(0)
}

\displaystyle{
\rho(\tau)=\phi^{|\tau|}
}

となります。
 安定条件 \displaystyle{
|\phi|\lt1
} の下で定常解を考えると、AR(1) 過程の自己共分散は

  • 時刻 \displaystyle{t} に依存せず
  • ラグ \tau のみで決まり
  • \gamma(\tau)=\gamma(0)\phi^ {|\tau|} という形になる

ことが示されました。したがって、AR(1) の安定な自己回帰過程は、弱定常性の条件(自己相関がラグだけで決まる)を満たします。
 安定なAR(1)過程では、平均、分散、自己相関が時間に依存せず一定となることが示せましたので、弱定常であることが確認できました。

※ もし記事の中で「ここ違うよ」という点や気になるところがあれば、気軽に指摘していただけると助かります。質問や「このテーマも取り上げてほしい」といったリクエストも大歓迎です。必ず対応するとは約束できませんが、できるだけ今後の記事で扱いたいと思います。それと、下のはてなブログランキングはあまり信用できる指標ではなさそうですが (私のブログを読んでいる人は、実際とても少ないです)、押してもらえるとシンプルに励みになります。気が向いたときにポチッとしていただけたら嬉しいです。