ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【正規分布の基礎5】レヴィの安定分布―足し算の向かう先は正規分布だけではない

これまでの正規分布にまつわる物語では、ド・モアブル(Abraham de Moivre, 1667–1754)からガウス(Carl Friedrich Gauss, 1777–1855)、ラプラス(Pierre-Simon Laplace, 1749–1827)、リャプノフ(Aleksandr Lyapunov, 1857–1918)へと続く歴史の中で、

「たくさん足し算をすると正規分布に近づく」

という事実がどのように理解され、定理として確立されていったかを見てきました。

 しかし20世紀に入り、数学者たちは新たな問いを抱き始めます。

「では、正規分布に近づかない“外側の世界”はどうなっているのか?」

「もっと極端な現象では、足し算の極限はどんな姿になるのか?」

 この問いに真正面から挑み、「足し算で現れるあらゆる極限分布を分類する」という偉業を成し遂げた人物が、フランスの数学者 ポール・レヴィ(Paul Lévy, 1886–1971) でした。

1. 極限分布の地図を完成させた数学者

 ポール・レヴィはパリの知的雰囲気に満ちた家庭に生まれました。父 アンリ・レヴィ(Henri Lévy)は、名門エコール・ポリテクニークの教授で、その影響もあって、ポールは幼いころから数学と科学の世界に自然に触れて育ちました。彼は読書家で、少年期から論理的な思考を好み、抽象的な問題に深い興味を示していたと伝えられています。

 レヴィは、エコール・ポリテクニークに進学して優秀な成績を収め、卒業後は母校で教授となり、解析学・測度論・確率論など幅広い分野の講義を担当しました。しかし、その数学のスタイルは「厳密さ一辺倒」というより、どこか大胆で、直感的で、構造を一気につかみとるような独特の閃きに満ちていました。弟子や同僚の証言によれば、レヴィはしばしば講義中に新しいアイデアを思いつき、その場で証明の方向性を組み立ててしまうような、自由奔放な一面を持っていたようです。

 家庭生活では、彼は温厚で家族を大切にする人物として知られていました。第二次世界大戦中、ユダヤ人であった彼は一時期ドイツの占領下で身の危険に晒されますが、家族や友人に支えられ、研究を継続しながら困難な時期を乗り越えています。その静かで粘り強い姿勢は、彼の数学――特に、確率論という「見えない構造」を扱う分野において、深い洞察につながっていったと想像されます。

 レヴィが生涯追い続けたのは、

「ランダムな足し算がつくり出す形の本質とは何か?」

という、一見素朴ながら実は巨大な問いでした。そして彼は、その問いを突き詰める中で、正規分布のさらに外側に広がる「安定分布」という広大な地図を描き上げることになります。

2. 安定分布とは何か:足し算で形を保つ分布

 レヴィが導入した核心の概念が 安定分布(stable distribution) です。安定分布とは何かを直感的に説明すると、

独立で同じ分布に従う確率変数をいくつか足すと、 その和(適切な平行移動・スケール変換後)が元と同じ種類の分布になる。

という性質を持つ分布のことです。

 つまり、足し算に対して形が変わらない分布です。

 数学的により厳密な定義を与えれば、以下のようになります。ここでは、確率変数 \displaystyle{
X
} の分布を \displaystyle{
\mathcal{L}(X)
} と書くことにします。\displaystyle{
X
}安定分布(stable) であるとは、次を満たすことをいいます。

【定義(安定分布)】

 確率変数 \displaystyle{
X
} は安定であるとは、任意の独立同分布な確率変数 \displaystyle{
X _ 1, X _ 2
} に対し、 適当な定数 \displaystyle{
a \gt 0
}, \displaystyle{
b \in \mathbb{R}
} が存在して

\displaystyle{
X_1 + X_2 \stackrel{d}{=} a X + b
}

が成り立つことをいう。

ここで、 \displaystyle{
\stackrel{d}{=}
} は「分布において等しい」ことを表します。

【厳密に安定な分布(strictly stable)】

 さらに、平行移動(location shift)が不要となる特別な場合:

\displaystyle{
X_1 + X_2 \stackrel{d}{=} aX
}

が成り立つとき、\displaystyle{
X
}厳密安定(strictly stable) と呼びます。

【一般の n 個の和への拡張】

 この定義は 2 個の和だけでなく、任意の \displaystyle{
n
} 個の独立同分布なコピー \displaystyle{
X _ 1, \dots, X _ n
} について

\displaystyle{
X_1 + X_2 + \cdots + X_n
\stackrel{d}{=}
a_n X + b_n
}

となる、というより一般的な条件と同値です。ここで、\displaystyle{
a _ n \gt 0
}, \displaystyle{
b _ n \in \mathbb{R}
} は、\displaystyle{
n
} に依存する定数です。正規分布はもちろんこの条件を満たします。しかし、レヴィは正規分布唯一ではないことを示しました。

3. 安定分布の特性関数

 安定分布は、一般の確率密度では閉じた形で書けない場合が多いため、 特性関数(確率密度関数フーリエ変換で定義します。

 ここでいう「閉じた形」とは、指数、対数、多項式三角関数、ガンマ関数など、ごく限られた基本的な関数を組み合わせただけで明確に書ける形のことを指します。たとえば、正規分布のように

\displaystyle{
f(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2 / (2\sigma^2)}
}

と、明確な式で表せることです。

 しかし安定分布の多くは、このような式として明示的に書ける密度関数をもたず、積分表や特別な特殊関数でも簡単に書けないため、その一般計は、特性関数を使って表現されます。

安定分布の特性関数(レヴィ–ヒンチン形)

 安定分布 \displaystyle{
S(\alpha, \beta, \gamma, \delta)
} の特性関数は次の形で与えられます(\displaystyle{
\alpha \neq 1
} の場合):

\displaystyle{
\phi(t)
= \exp\left\{
i\delta t - \gamma^\alpha |t|^\alpha
  \left[ 1 - i\beta \,\mathrm{sign}(t) \,\tan\left(\frac{\pi\alpha}{2}\right) \right]
  \right\}.
}

\displaystyle{
\alpha=1
} の場合は別の形が使われます(今回は、これは省略します)。

4. 4つのパラメータの意味

 安定分布は、次の4つのパラメータで分類されます。

パラメータ 意味 範囲 直感的イメージ
\displaystyle{\alpha} 安定指数(特性指数) \displaystyle{0 \lt \alpha \le 2} 分布の裾の重さ、どれほど極端な値が出やすいか
\displaystyle{\beta} 歪度(skewness) \displaystyle{[-1, 1]} 左右どちらに偏っているか
\displaystyle{\gamma} スケール(尺度) \displaystyle{>0} 広がりの大きさ(正規分布標準偏差に対応)
\displaystyle{\delta} 位置(location) 実数 中心の位置

特に重要なのが、\displaystyle{
\alpha
} です。たとえば、

  • \displaystyle{
\alpha = 2
} のとき、正規分布
  • \displaystyle{
\alpha = 1
} のとき、コーシー分布
  • \displaystyle{
\alpha = 1/2
} のとき、レヴィ分布

になり、\displaystyle{
\alpha \lt 2
} では、分散が無限大になります。つまり、分散が有限なのは、正規分布だけです。

 ここで、紹介した 3 つの例について、それらが安定分布になっていることを確かめてみます。その際、まず押さえておきたいのは、特性関数と確率密度の関係です。

フーリエ変換で、特性関数から密度を求められる

 特性関数 \displaystyle{
\phi(t)=E[e^ {itX}]
} は確率分布のフーリエ変換ですから、 密度関数 \displaystyle{
f(x)
} は、逆フーリエ変換によって次のように求められます。

\displaystyle{
f(x)
=
\frac{1}{2\pi}\int_{-\infty}^{\infty} e^{-itx}\,\phi(t),dt.
}

 多くの安定分布は、確率密度関数が閉じた形で書けませんが、特性関数さえわかれば逆変換によって分布を一意に決めることはできます。つまり、「確率密度関数が書けない」=「扱えない」ではなく、「確率密度関数を直接書くより、特性関数で考えたほうが統一的に扱える」な分布なのです。

 では、特性関数を使いながら、3つの代表例が本当に安定になっていることを確認してみましょう。

正規分布\displaystyle{\alpha = 2,\ \beta = 0}

 特性関数は、

\displaystyle{
\phi(t)=\exp\left(i\delta t-\gamma^2 t^2\right).
}

これは、安定分布の一般形

\displaystyle{
\exp\left(-\gamma^\alpha |t|^\alpha + i\delta t\right)
}

\displaystyle{
\alpha=2
} に対応しています。

 これが安定分布であることを確かめてみます。独立な正規分布 \displaystyle{
X _ 1, X _ 2
} の和の特性関数は

\displaystyle{
\phi_{X_1+X_2}(t)=\phi_{X_1}(t)\, \phi_{X_2}(t)
= \exp\left(-(\gamma_1^2+\gamma_2^2)t^2+i(\delta_1+\delta_2)t\right),
}

になります。この指数の部分は、元と同じ関数形(\displaystyle{
t^ 2
} 型)になっているので、「足しても正規分布の形が保たれる」ことがわかります。つまり、安定分布になっています。

 確率密度は、逆変換を使わなくてもフーリエ変換の一意性から、

\displaystyle{
f_{\text{normal}}(x)
= \frac{1}{\sqrt{4\pi\gamma^2}}
\exp\!\left(-\frac{(x-\delta)^2}{4\gamma^2}\right)
}

となることがわかります。

② コーシー分布(\displaystyle{\alpha = 1,\ \beta = 0}

 特性関数は、

\displaystyle{
\phi(t)
= \exp\!\left(-\gamma |t| + i\delta t\right).
}

これは、安定分布の一般形

\displaystyle{
\exp\!\left(
-\gamma^\alpha |t|^\alpha
+ i\delta t
\right)
}

\displaystyle{\alpha = 1} に対応しています。

 これが安定分布であることを確かめてみます。独立なコーシー分布 \displaystyle{X_1, X_2}(それぞれスケール \displaystyle{\gamma_1, \gamma_2}、位置 \displaystyle{\delta_1, \delta_2}) の和の特性関数は、

\displaystyle{
\phi_{X_1+X_2}(t)
=
\phi_{X_1}(t)\,\phi_{X_2}(t)
=
\exp\!\left(
-(\gamma_1+\gamma_2)\,|t| + i(\delta_1+\delta_2)t
\right).
}

となり、指数部分の \displaystyle{|t|} がそのまま保たれています。 すなわち、「足してもコーシー型の形が変わらない」ことが特性関数からわかり、コーシー分布は安定分布になっています。

 確率密度は、

\displaystyle{
f_{\text{Cauchy}}(x)
=
\frac{1}{\pi}\,
\frac{\gamma}{(x-\delta)^2+\gamma^2}
}

となることがわかります。平均も分散も存在しませんが、確率密度としてはこの形で与えられます。

③ レヴィ分布(\displaystyle{\alpha = \tfrac12,\ \beta = 1}

 特性関数は、

\displaystyle{
\phi(t)=
\exp\!\left(
i\delta t
-
\gamma^{1/2}|t|^{1/2}\,
\bigl(1 - i\,\mathrm{sign}(t)\bigr)
\right).
}

これは、安定分布の一般形

\displaystyle{
\exp\!\left(
-\gamma^\alpha |t|^\alpha
\left(1 - i\,\beta\,\mathrm{sign}(t)\tan\frac{\pi\alpha}{2}\right)
+ i\delta t
\right)
}

\displaystyle{\alpha=\tfrac12,\ \beta=1} に対応しています。

 この分布が安定になっていることを確かめてみます。 独立なレヴィ分布 \displaystyle{X_1, X_2} の和の特性関数は、

\displaystyle{
\phi_{X_1+X_2}(t)
=
\phi_{X_1}(t)\,\phi_{X_2}(t)
=
\exp\!\left(
-(\gamma_1^{1/2}+\gamma_2^{1/2})\,|t|^{1/2}
\bigl(1 - i\,\mathrm{sign}(t)\bigr)
+
i(\delta_1+\delta_2)t
\right).
}

となり、指数部分の \displaystyle{|t|^{1/2}} がそのまま保たれています。すなわち、複雑な形をしていても「足したときに形が変わらない」という安定性が、特性関数から直接読み取れます。

 確率密度は、逆フーリエ変換の計算を行うことで、

\displaystyle{
f_{\text{Lévy}}(x)
=
\sqrt{\frac{\gamma}{2\pi}}\,
\frac{1}{(x-\delta)^{3/2}}
\exp\!\left(
-\frac{\gamma}{2(x-\delta)}
\right),
\qquad x>\delta,
}

となることが知られています。この分布は、極端に重い裾をもち、ジャンプが頻繁に現れる現象を表す典型的な分布です。

6. 一般化中心極限定理:極限分布は安定分布だけ

 レヴィが成し遂げた最大の功績は、「独立な確率変数の和の極限として現れうる分布は、安定分布以外には存在しない」という、驚くほど包括的な結論を示した点にあります。これによって、従来の中心極限定理が語っていた世界が、実はもっと大きな枠組みの一部にすぎなかったことが明らかになりました。

 古典的な中心極限定理は、次のような限定された状況を扱います。

有限の分散をもつ \displaystyle{n} 個の独立同分布の和は、 \displaystyle{\sqrt{n}} で割ると正規分布に近づく。

 つまり、分散が存在し、極端な値が出る確率が十分に小さい「穏やかな」ゆらぎの世界では、正規分布が普遍的な極限として現れます。

 しかし、レヴィはここで立ち止まらず、「では、分散が無限大の場合はどうなるのか?」「もっと荒々しいゆらぎの世界では、極限として何が現れるのか?」という問いを徹底的に追いかけました。そして到達した結論が次の一般化です。

独立同分布の和は、スケールの取り方(正規化)を適切に選べば、 必ず安定分布に収束する。

 言い換えれば、足し算の極限として出現する分布は安定分布しかないということです。正規分布は、その安定分布ファミリーの中で「分散が有限な唯一のメンバー」であり、極端な値がほとんど現れない場合に限って、極限として姿を現します。

 この視点から見ると、正規分布は「どこにでも現れる普遍分布」であると同時に、安定分布というより広い森の中の「特別に穏やかな一点」であることがわかります。レヴィの一般理論は、中心極限定理を囲む景色を一気に広げ、正規分布を全体の中の特別な一点として位置づける、新しい地図を描いたと言えるのです。

5. まとめ:正規分布の外側に広がる世界

 正規分布をめぐる物語は、ド・モアブル、ガウスラプラス、リャプノフの仕事を通じて、「たくさん足し算をすると正規分布に近づく」という事実をどのように理解し、どこまで一般化できるかを追いかけてきた歴史でした。そこから見えてきたのは、「有限分散で、極端な値があまり出ない穏やかな世界」では、正規分布が足し算の普遍的な極限として現れる、という描像です。

 一方、ポール・レヴィは、あえてその外側――分散が無限大になるような荒々しいゆらぎや、まれではない極端現象――に目を向けました。その結果生まれたのが安定分布の理論であり、「足し算の極限として現れうる分布は、すべて安定分布である」という一般化中心極限定理でした。正規分布はその中で「分散が有限な唯一のメンバー」にすぎず、コーシー分布やレヴィ分布のような重い裾をもつ分布も、同じ安定分布ファミリーのなかに自然に位置づけられます。

 この視点に立つと、中心極限定理とレヴィの安定分布の理論は、互いに矛盾するのではなく、ゆらぎの世界を内側と外側から照らす二つの補完的な視点であることがわかります。ひとつは、「なぜ多くの現象が正規分布へと収束するのか」という穏やかな世界の普遍性を教え、もうひとつは、「なぜ、ときに正規分布から外れ、どのような別の普遍性が立ち現れるのか」という極端な世界の構造を描き出します。正規分布はこの大きな地図の一角に過ぎず、その周囲には、重い裾やジャンプを特徴とする多様な安定分布が広がっています。こうした全体像を手にすることで、私たちは、自然界・社会・生体のデータに潜むゆらぎや極端現象を、従来よりもはるかに広い視野と柔軟な発想で理解できるようになるのだと感じます。

 近年では、機械学習・データサイエンスの分野でも安定分布の応用が急速に広がっています。特に外れ値(アウトライア)やノイズが強いデータを扱う場面では、損失関数やモデル誤差を正規分布ではなく安定分布に基づいてモデル化するアプローチが注目されています。たとえば、「安定分布に従うノイズを仮定した線形回帰」や「深層学習における重み更新の確率的特性」など、ロバスト性が求められる領域での研究が進んでいます。また、生成モデル(GAN・拡散モデル)における潜在空間の分布として、ガウスよりも「重い裾」を持つ安定分布を採用する試みも報告されています。

 さらに、生物学・脳科学・行動科学といった実世界のデータ解析でも、レヴィフライトやレヴィ過程の応用可能性が少しずつ検討されつつあります。動物の探索行動やヒトの移動パターン、視線のジャンプ(サッカード)などの統計構造に、安定分布的な特徴が見られるという報告もあり、今後の研究の進展が期待されるところです。