ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

有限幅のゆらぎか、広がり続けるゆらぎか、そして、その境界としての 1/f ノイズ

1/f^{\beta} 型のパワースペクトルと一口に言っても、指数 \beta の値によって、その統計的・物理的性質は大きく異なります。教科書や論文で典型的に議論されるのは、概ね

\displaystyle -1 < \beta < 3

程度の範囲であり、この範囲で、弱定常過程、ホワイトノイズ・非整数ガウスノイズ(fractional Gaussian noise)、長期記憶過程、ブラウン運動・非整数ブラウン運動(fractional Brownian motion)が含まれます。

1/f^{\beta} 型パワースペクトルを示す時系列の例。左下は、時系列から計算した自己相関関数、右下は、時系列から計算したパワースペクトル。 \beta \lt 1 では有限幅変動、 \beta \gt 1 では拡散的変動になる。

 一方で、各周波数成分の位相が独立かつ一様にランダムである(ランダム位相)という条件のみを課し、さらに

  • 観測されるのは有限長の標本時系列である
  • 低周波側での分散の発散(\int S(f)\,df の収束性)を問題にしない

という立場を取るならば、有限長の時系列としては \beta の値に上限はありません。 実際、有限区間・有限分解能で生成されたランダム位相のスペクトルに対しては、どれほど大きな \beta を与えても、数値的には整合した標本時系列を構成することが可能です。

 この点は、Hurst(ハースト)指数やフラクタル次元と比較すると対照的です。例えば、自己相似(自己アフィン)性をもつ確率過程(典型的には fractional Brownian motion)では、Hurst 指数は

\displaystyle 0 < H < 1

に制限され、数学的拡張として H>0 を考えることはできても、確率過程としての解釈には明確な制約が生じます。また、1 次元時系列のサンプルパスのフラクタル次元は

\displaystyle 1 < D < 2

に厳密に制限され、この範囲を超える拡張は定義上不可能です。

 このように、1/f^{\beta} 型スペクトルにおける \beta は、有限長・ランダム位相という実用的仮定の下では自由度が高い量であり、パワースペクトル表現の懐の深さをよく表しています。

 1/f^{\beta} 型スペクトルをもち、各周波数成分の位相が独立かつ一様にランダムである確率過程(ランダム位相近似)をタイプ別に分類する際には、まず

\displaystyle -1 < \beta < 1
\displaystyle 1 < \beta < 3

の 2 つの範囲を基本として考えるのが一般的です。 これらは、それぞれ弱定常過程および非定常だが増分が定常な過程として、代表的な物理的・確率論的解釈を与えることができます。

ここから、時系列に差分をとる操作によって「\beta が 2 減少する」、あるいは積分(累積和)をとる操作によって「\beta が 2 増加する」と考えれば、

\displaystyle -3 < \beta < -1
\displaystyle 3 < \beta < 5

といった範囲についても、基本領域との対応関係として系統的な説明を与えることが可能になります。

上下の変動幅がほぼ一定の “有限幅”過程 (左) と、時間とともに上下の広がりが拡大する “拡散的”過程 (右)

 ここまで、やや細々とした説明をしましたが、今回強調したいのは、時間領域でのふるまいに注目すると、1/f^{\beta} 型パワースペクトルもつ変動の性質は本質的に2つに分かれるということです。つまり、上のイラストのように、

  •  \beta \lt 1:変動が有限な幅にとどまる(非拡散的)
  •  \beta \gt 1:時間とともに拡散的に広がっていく(拡散的)

のどちらかに分類できます。そして、その二つの境界に位置するのが 1/f ノイズ( \beta = 1)であるということです。

 この有限幅領域拡散領域という 2 つのふるまいの違いを意識することは、数理的な背景を正しく理解するうえでも、また目的に応じて解析手法を使い分けるうえでも、非常に重要です。

1. 自己相関(自己共分散)は役に立つ?:時間差だけの関数になるかどうか

 自己相関(あるいは自己共分散)は、時系列解析において最も基本的な道具のひとつです。 弱定常過程に限れば、自己相関がほぼすべての情報を担っていると言っても過言ではありません。 自己相関は、「過去の値が現在の値とどの程度関係しているか」を定量的に表す指標です。

 ただし、自己相関が常に役に立つとは限りません。その有効性を左右する決定的なポイントは、

自己相関(自己共分散)が「時間差」だけの関数になっているかどうか

という点にあります。

 1/f^{\beta} 型パワースペクトルをもつ時系列については、

  •  \beta \lt 1(有限幅の変動・弱定常な場合):自己相関は 時間差だけの関数として定義でき、解析に有効
  •  \beta \gt 1(拡散的な変動・非定常):自己相関は 観測時刻にも依存し、時間差だけの関数とはならないため、直接的な解釈は困難

と整理できます。

 ウィーナー=ヒンチンの定理(Wiener–Khinchin theorem)が成り立つことから、「自己相関とパワースペクトルは同じ情報を持っている」と覚えている方もいるかもしれません。 しかし実際には、両者は常に同じように役に立つわけではありません。

 重要なのは、パワースペクトルはいつでも定義でき、有効に使えるのに対して、自己相関は役に立たない場合があるという点です。とくに、変動が時間とともに拡散していくような時系列では、自己相関は「時間差だけの関数」とならず、その解釈が難しくなります。この違いを意識することが、自己相関とパワースペクトルを正しく使い分けるための第一歩になります。

2. 非整数ブラウン運動としての Hurst 指数 H と非整数ガウスノイズのHの違いを意識する

 Hurst 指数 H は、もともと 非整数ブラウン運動(fractional Brownian motion, fBm)を特徴づける指数として導入されました。 非整数ブラウン運動とは、通常のブラウン運動を「拡散の程度」という観点から一般化した確率過程です。

 非整数ブラウン運動としての H は「拡散の程度」を評価しているのですから、

  • \beta \gt 1 のとき、時系列は拡散的な変動を示すため、非整数ブラウン運動として H を自然に解釈できる

  • \beta \lt 1 のとき、時系列は有限幅の変動にとどまるため、非整数ブラウン運動そのものとして解釈することはできない

という判断になります。

 非整数ブラウン運動  B _ H(t) のパワースペクトルは、低周波側で

\displaystyle
S(f) \sim \frac{1}{f^{2H + 1}}

となります。この関係から、

\displaystyle
\beta = 2 H + 1 \quad (1 < \beta < 3
\ \Longleftrightarrow \ 
0 < H < 1)

という対応が成り立ちます。

 この領域こそが、Hurst 指数が本来定義された「自然な舞台」です。

なぜ H の解釈はややこしくなるのか

 ここで、「定常過程である非整数ガウスノイズ(fractional Gaussian noise)の特徴づけにも H を使うのはなぜだろう?」と疑問に思うかもしれません。 このややこしさの原因は、非整数ブラウン運動そのものではなく、その「差分」をとっている点にあります。

 非整数ガウスノイズは、Hurst 指数が H の非整数ブラウン運動を差分したものとして定義されます。そのため、非整数ブラウン運動と同じ値の H が、非整数ガウスノイズの特徴づけにも用いられます。

この結果、同じ H という値を使っていても、見ている時系列のタイプはまったく異なるという状況が生じます。この点が、Hurst 指数の解釈を少し分かりにくくしている理由なのです。

 非整数ガウスノイズは、非整数ブラウン運動の差分

\displaystyle
X_H(t) = B_H(t+1) - B_H(t)

として与えられます。この非整数ガウスノイズは、有限幅の変動を示す弱定常過程になり、パワースペクトルは

\displaystyle
S(f) \sim \frac{1}{f^{\beta}}, \qquad \beta = 2H - 1

となります。

 Detrended Fluctuation Analysis(DFA)やDetrending Moving Average analysis(DMA)を用いて、時系列の拡散性に注目しながら Hurst 指数 H を推定する際には、 積分(累積和)と差分の操作を適切に使い分けることが重要になります。

 \beta の範囲ごとに整理すれば、

  •  1 \lt \beta \lt 3 のとき、その時系列は、すでに非整数ブラウン運動的である
  •  -1 \lt \beta \lt 1 のとき、元の時系列を 1 回積分すると、非整数ブラウン運動的になる
  •   3 \lt \beta \lt 5 のとき、元の時系列の差分を 1 回とると、非整数ブラウン運動的になる

となり、さらに、

  •  -3 \lt \beta \lt -1 のとき、元の時系列を 2 回積分すると、非整数ブラウン運動的になる

ということになります。

 もともと、DFAやDMAは、非拡散的(有限幅の)変動をもつ時系列(fGn的時系列)も解析できるように設計されています。そのため、解析の最初の段階に、時系列を積分(累積和)する操作が組み込まれています。したがって、元の時系列がすでに拡散的なふるまいを示している場合には、この積分操作は必ずしも必要ではありません。

3. フラクタル性とフラクタル次元はいつ役に立つ?

 フラクタル性やフラクタル次元も、時系列解析でよく使われる概念です。とくに「波形のギザギザ具合(粗さ)」を、スケールを変えながら 1 つの数で表したいときに登場します。ただし、ここでいうフラクタル次元 D は、時系列そのもの(値の集合)の次元ではなく、「時系列を平面上に描いたグラフ」の近似的なフラクタル次元です。1 次元時系列のグラフを連続的な線とみなせば、線分の次元は1、2次元図形の次元は2なので、直感的にも

\displaystyle 1 \le D < 2

の範囲に収まることが期待できます。そして重要なのは、離散時系列の実データでは 「無限に細かいスケールまで見た極限の D」を直接観測できるわけではなく、あくまで有限区間・有限スケール範囲で D を推定している、という点です。

 \beta D の対応が素直に成り立つのは  1 \lt \beta \lt 3

 1/f^ {\beta} 型スペクトルをもつ自己アフィン過程(典型例:fractional Brownian motion)では、Hurst 指数 H とスペクトル指数 \beta の間に

[tex:\displaystyle \beta = 2H+1 \qquad (0

が成り立ちます。さらに、グラフのフラクタル次元 D

\displaystyle D = 2 - H

なので、両者を合わせると

\displaystyle D = 2-\frac{\beta-1}{2} = \frac{5-\beta}{2} \qquad (1<\beta<3)

という対応関係が成り立ちます。

 \beta\displaystyle 1 \le \beta \le 3 の範囲外にあると、やや強引ですが(数値的に解析すれば)、   * \beta \lt 1 のとき、D=2 (フラクタル性はない)

  • \beta \gt 3 のとき、D=1 (フラクタルじゃない)

のように、値が飽和して、時系列の特徴を分類できなくなります。    では、\displaystyle 1 \le \beta \le 3 の範囲外で、フラクタル次元が全く役に立たないかといえば、そうではありません。必要に応じて、積分(累積)で [\tex: \beta] を2増加させたり、差分をとって [\tex: \beta] を2減少させたりしてから、D を推定すれば、全く使えないとまでは言えません。誤ったフラクタル次元 D を推定しないように、 \beta の値の範囲を意識するようにしてください。

※ もし記事の中で「ここ違うよ」という点や気になるところがあれば、気軽に指摘していただけると助かります。質問や「このテーマも取り上げてほしい」といったリクエストも大歓迎です。必ず対応するとは約束できませんが、できるだけ今後の記事で扱いたいと思います。それと、下のはてなブログランキングはあまり信用できる指標ではなさそうですが (私のブログを読んでいる人は、実際とても少ないです)、押してもらえるとシンプルに励みになります。気が向いたときにポチッとしていただけたら嬉しいです。