ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【時系列解析の基礎】「弱定常」中心主義:「実世界の要請」ではなく「数学的理想化」

時系列解析のほとんどの教科書では、「弱定常(weak stationarity、weak-sense stationarity)」という概念が、解析の前提条件として導入されます。この前提を理解することは、理論的枠組みを整理し、数理的な議論を追ううえでは確かに有用です。しかし、実際の時系列解析において、そのような都合のよい前提が成り立つとは限らないということは、常に意識しておく必要があります。
 つまり、弱定常性は、現実の時系列が本来備えている性質とは限りません。それは、理論を構築し、解析手法を数学的に成立させるために要請された理想化にすぎません。
 現実世界の時系列——とりわけ生体信号のようなデータ——が、都合よく弱定常であると考えるのは現実的ではありません。むしろ、多くの場合、そのような時系列は弱定常ではなく非定常です。実世界で観測される時系列のうち、実験条件が十分に制御され、かつ再現性が高い場合に限って、弱定常であることが期待できます。一方、生体から計測されるデータでは、トレンドの除去などの前処理を施したうえで、あくまで粗い近似として弱定常とみなす、という立場を取らざるを得ません。

弱定常とは何を「仮定」しているのか

 弱定常とは、次のような仮定です。

  • 平均は時間によらず一定
  • 分散は時間によらず一定
  • 自己相関(あるいは自己共分散)は「2つの異なる時点の時間差だけ」で決まる

 弱定常な確率過程(弱定常過程)の枠組みにおいて、現在・過去と将来を結びつける動的な情報として明示的に扱われるのは、自己相関だけです。平均や分散は時間に依存した変化を特徴づけていませんので、時間発展に関する情報を含みません。そのため、弱定常性の仮定のもとでは、時系列の時間的構造は自己相関関数によって特徴づけられることになります。自己相関とは、ある時点の値が「どの程度、どれくらい後(あるいは前)の値と似ているか」を、時間差ごとに定量化した指標です。言い換えれば、時間差  \tau だけ離れた2点を比較したときに、大きい値の後に大きい値が続きやすいのか、あるいは正負が反転しやすいのかといった「時間的なつながりの強さと符号」を表しています。弱定常過程では、この「時間差ごとの似かた」だけが、時系列の時間構造を記述する唯一の情報となります。
 この意味で、弱定常の世界では、「将来の振る舞いは自己相関によって規定される」と言うことができます。ただしこれは、自己相関が未来を完全に決定するという意味ではありません。あくまで、統計的に見たときに、将来に関する情報が自己相関に集約されているということを意味しています。
 この状況を例えるなら、「私たちの将来は学歴だけで決まる」と考えることに似ています。学歴は将来に一定の影響を与えるかもしれませんが、それだけで人生のすべてが決まるわけではありません。同様に、弱定常過程では、自己相関は重要な情報を含みますが、それだけで時系列のすべての特性が語り尽くされるわけではありません。特に、非線形性や非ガウス性、時間とともに変化する構造といった要素は、自己相関だけでは捉えられません。
 したがって、「弱定常の枠組みでは自己相関が中心的な役割を果たす」という事実(自己相関中心主義)と、「自己相関だけで実世界の時系列の本質が完全に記述できる」と考えることは、明確に区別する必要があります。弱定常性とは、時系列を理解するための一つの強い単純化であり、その有効性と限界を意識した上で用いるべき仮定なのです。
 ちなみに、私は数年前、娘の大学受験をきっかけに、最近の受験事情を知ろうとして YouTube で情報を集めていました。その際に、wakatte.tv というチャンネルを見る機会がありました。そのチャンネルでは、学歴を強く人の価値判断の基準とする、いわば学歴至上主義的な視点が前面に出たコンテンツが多く発信されています。そうした語り口には、将来の可能性をこれから広げていく若者に対して、過度に偏向した価値観を刷り込んでしまう危うさがあると感じました。
 私は、wakatte.tvで賞賛されるような大学を卒業しているわけでもなく、さらに、学生時代は工事現場などで働きながら留年と休学を繰り返し、卒業までに8年を要しています。そのため、wakatte.tvで語られる価値観に触れたとき、自分の今までの人生は価値のないものだったのだと落胆しました。
 もっとも私は、学歴にかかわらず、これまでの研究人生を振り返ると、研究そのものは非常に楽しく、充実したものだったと実感しています。その意味では、少なくとも私自身にとって、学歴は人生や研究の価値を決定づけるほど重要な要素ではなかったのだと思います。そして、「自己相関」もまた、時系列解析に取り組むうえで確かに重要な概念ではありますが、それだけがすべてではなく、他にも注目すべき大切な側面があるはずだと考えています。
 ちなみに、確率過程の定常性には「定常(強定常)」と呼ばれる、より強い条件も存在します。 強定常とは、平均や分散、自己相関といった低次の統計量だけでなく、任意の次数の統計量、あるいは、その過程の同時分布が、時間の原点をどれだけ平行移動しても変わらないという性質です。これは、どの時点を切り取っても(いつでもどこでも)、確率過程全体の統計的振る舞いが完全に同一であることを要求します。この仮定は、多くを求めすぎて、現実のデータに対して検証することはほぼ不可能であり、実際の解析で直接用いられることはほとんどありません。そのため、実務的な時系列解析では、必要最小限の仮定として平均、分散、自己相関の時間不変性のみを課した弱定常性が採用されているのです。強定常過程の例としては、弱定常かつ、正規分布に従うガウス過程があります。これであれば、数学的な扱いはすっきりしています。

弱定常の概念を理解するポイント

 私が学生に向けて弱定常(weak stationarity)を説明するときに、まず理解してほしいと考えているのは、以下の2点です。
(1)期待値とは何を意味しているのか
(2)自己相関とは何を測っている量なのか
ここでは、この二点に絞って説明します。

弱定常の数式的定義

 確率過程  \{X(t)\}弱定常であるとは、次の条件を満たすことを指します。

  1. 平均が時間によらず一定
\displaystyle{
\mathbb{E}[X(t)] = \mu
}
  1. 分散が時間によらず一定
\displaystyle{
\mathrm{Var}[X(t)] = \sigma^2
}
  1. 自己共分散が時刻差(ラグ)のみの関数
\displaystyle{
\mathrm{Cov}[X(t), X(t+\tau)] = \mathbb{E}\big[(X(t)-\mu)(X(t+\tau)-\mu)\big] = C(\tau)
}

 ここでは説明の都合上、条件 2 と 3 を分けて書いていますが、分散は自己共分散に含まれるので、独立した条件ではありません。実際、自己共分散において、\displaystyle{
\tau = 0
} とすると,

\displaystyle{
C(0)
= \mathrm{Cov}[X(t),X(t)]
= \mathrm{Var}[X(t)]
}

となります。したがって、条件 3 において自己共分散が時刻差 \tau のみの関数として書けると仮定すれば \tau=0 の場合も時間 t に依存しないことが保証され、分散が一定であるという条件 2 は自動的に満たされます。
 この意味で,弱定常性は

  • 期待値が時間(時間シフト)によらず一定であること
  • 自己共分散が時刻差(ラグ)のみの関数であること

2 条件として定義しても差し支えありません。条件 2 をあえて明示的に書くのは、分散が「ばらつきの大きさ」を表す量として直感的に重要であり、理解の助けになるためです。

複数のサンプルパス

期待値はアンサンブル平均で、時間平均じゃない

 上の定義に現れる期待値 \displaystyle{
\mathbb{E}[\cdot]} は、時間平均ではなく、アンサンブル平均を意味します。
 すなわち、上図のように

  • 同じ確率法則に従う時系列を無数に用意し
  • 同じ時刻  t における値を集めて平均する

という操作を数学的に理想化したものが期待値です。上図では、 t _ 1 での期待値(アンサンブル平均)が \displaystyle{
\mathbb{E}[t _ 1]}t _ 2 での期待値が \displaystyle{
\mathbb{E}[t _ 2]} です。「期待値が時間(時間シフト)によらず一定」というのは、時間軸上の任意の2点 t _ 1t _ 2 で常に

\displaystyle{
\mathbb{E}[t _ 1] = \mathbb{E}[t _ 2]
}

ということです。
 とはいえ、実際の観測では、同一条件で無限個の時系列を用意することはできず、一回しか時系列を計測できないかもしれません。そのため、

  • 理論では「アンサンブル平均」
  • 実データ解析では「時間平均で近似」

という立場を取ることが多いです。弱定常という仮定は、そのような近似が意味を持つための前提条件でもあります。時間平均とアンサンブル平均の計算については、以下の図も参考にしてください。

時間平均。時間平均は、時間軸方向に並んだ一本のデータを対象とする。

アンサンブル平均。アンサンブル平均は、複数回の計測結果を用い、同じ時刻に計測されたデータを対象とする。

自己共分散・自己相関の定義はいろいろある

 自己相関や自己共分散は、分野や文献によって定義や用語の使い方が統一されていません。とくに、

  • 平均を差し引くかどうか
  • 正規化を行うかどうか

の違いによって、同じ記号でも異なる量を指す場合があります。以下に代表的な定義を整理します。

(1)自己共分散(autocovariance function)

 最も標準的な定義は,平均との差を取った形の自己共分散です。

\displaystyle{
C(\tau)
= \mathbb{E}\big[(X(t)-\mu)(X(t+\tau)-\mu)\big]
}

これは、時刻差 \tau だけ離れた 2 点の「共変動の大きさ」を表します。理論的な議論では、この定義が基準として用いられることが多くなっています。

(2)自己相関係数(autocorrelation function / autocorrelation coefficient)

 自己共分散を分散で正規化したものは,自己相関係数と呼ばれます。

\displaystyle{
\rho(\tau)
= \frac{C(\tau)}{\sigma^2}
}

この量は -1 \le \rho(\tau) \le 1 を満たし,通常の相関係数と同様に,

  • \rho(\tau)=1:完全に同じ振る舞い
  • \rho(\tau)=0:無相関

といった直感的な解釈が可能です。英語では autocorrelation function (ACF) と呼ばれることが多くあります。

(3)平均との差を取らない自己相関(自己共分散)(raw autocorrelation / second moment)

 一方,一部の文献では,平均を差し引かない次の量を「自己共分散」、あるいは、「自己相関」と呼ぶ場合があります。

\displaystyle{
R(\tau)
= \mathbb{E}\big[X(t)\,X(t+\tau)\big]
}

この定義は、信号処理や物理学のめんどくさがり屋び研究者に用いられることがあります。この量は平均値  \mu にも影響を受け、

\displaystyle{
R(\tau) = C(\tau) + \mu^2
}

となりますので、平均がゼロでない場合には注意が必要です。

自己相関とは何か ― 相関係数の時系列版

 自己相関は、相関係数の考え方を、同一の時系列の異なる時刻に適用したものと言えます。
 通常の相関係数は「2つの異なる変数 XY の線形な関係性(直線性)」を測りますが、自己相関では、

  • 自分同士の X(t)X(t+\tau)

関係性を測ります(下図参照)。
 したがって自己相関が大きいということは、「ある時刻で大きい(小さい)値を取ると、少し後の時刻でも同じ傾向を保ちやすい」ということを意味します。

自己相関は  x _ t x _ {t - \tau}の相関を評価したもの。自己回帰過程  x _ t = 0.9 x _ {t - 1} + \epsilon _ t の例。

なぜ自己相関はタイムラグだけの関数になるのか

 弱定常では、自己相関(あるいは自己共分散)が、2つの時刻 ts には依存せず、その時間差 \tau = t-s のみに依存**します。
 これは、

  • 「いつ観測を始めても、統計的な性質は同じ」
  • 「重要なのは“どれだけ時間が離れているか”だけ」

ということです。

弱定常じゃない時系列の例

 ここでは、時系列を一目見て「このデータは弱定常ではなさそうだ」と直感的に感じられる例を示します。弱定常では、平均、分散、自己相関構造が時間によらず一定であることが仮定されますが、下図に示した例はいずれもその仮定が破れている時系列です。

非定常性時系列の例。(左上)平均値が途中で変化する時系列、(右上)直線トレンドを含む時系列、(左下)局所分散が増加する時系列、(右下)拡散時系列(分散が発散)。

 上図の左上では時系列の途中で、明らかに基準となる水準(平均値)が切り替わっています。このような平均の構造変化(レベルシフト)が存在すると、平均は時間に依存するため、弱定常性の仮定は満たされません。実データでは、環境条件の変化、制度変更、装置設定の切り替えなどが原因になることが多くあります。
 上図の右上では、時間とともに値が一方向に増加または減少する直線的トレンドを含む例です。この場合、平均値が時間とともに連続的に変化しており、自己相関もトレンドの影響を強く受けます。そのため、見かけ上の長期相関が生じやすく、弱定常過程として解析すると誤解を招く可能性があります。
 上図の左下は、時間の経過とともに変動の振幅が大きくなっていく例です。これは分散が時間に依存して変化している状態であり、弱定常性の「分散一定」という仮定に反します。金融時系列や生理信号などでは、活動状態の変化に伴ってこのような振る舞いが観察されることがあります。
 上図の右下はランダムウォークに代表される拡散的な時系列で、時間が進むにつれて分散が際限なく増大します。この場合、平均は一定に見えても、分散が定義できない、あるいは時間とともに発散するため、弱定常過程とはみなせません。自己相関も通常の意味では定常的に定義できなくなります。
 このように、平均の変化、トレンドの存在、分散の時間依存性、拡散的増大はいずれも、弱定常性を疑う重要な視覚的サインです。

弱定常だが自己相関では完全に特徴づけられない過程

 弱定常であることは、その過程の統計的性質が自己相関(2 次統計量)だけで完全に記述できることを意味するわけではありません。自己相関のみで過程を完全に特徴づけられるのは、確率分布がガウス分布に従う場合に限られます。
 非ガウスな弱定常過程では、自己相関やパワースペクトルが同一であっても、振幅分布の歪みや尖度、局所的な分散の揺らぎ、間欠性といった性質は大きく異なることがあります。そのため、非ガウス過程やマルチフラクタル過程、ランダムな平均値をもつ定常過程などでは、自己相関に加えて、高次統計量や多重スケール分布を用いた解析が不可欠となります。

まとめ

 弱定常中心主義については否定的な意見も述べましたが、弱定常が作り出す世界の構造をきちんと理解すること自体は非常に重要です。非線形システムを理解するために、まず線形システムの性質を丁寧に学ぶ必要があるのと同様に、非定常過程を深く理解するためにも、弱定常過程の枠組みをしっかりと理解しておくことが不可欠です。そのうえで、基礎の理解を大切にしつつ、弱定常中心主義を疑う視点もあわせて養ってください。

※ もし記事の中で「ここ違うよ」という点や気になるところがあれば、気軽に指摘していただけると助かります。質問や「このテーマも取り上げてほしい」といったリクエストも大歓迎です。必ず対応するとは約束できませんが、できるだけ今後の記事で扱いたいと思います。それと、下のはてなブログランキングはあまり信用できる指標ではなさそうですが (私のブログを読んでいる人は、実際とても少ないです)、押してもらえるとシンプルに励みになります。気が向いたときにポチッとしていただけたら嬉しいです。