ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【非ガウス分布の基礎3】キュムラントって何?:正規分布は分布の世界に中心にいる

確率分布の形状を記述する統計量として、平均・分散・歪度・尖度といった モーメント(moment) に基づく指標が代表的に紹介されます。これらは分布の特徴を把握するうえで基本的かつ重要な量です。しかし、モーメントだけで確率密度関数を一意に定めるためには、原則として無限次までのすべてのモーメントが必要 となります。したがって、低次のモーメントだけに基づいて議論する場合には、分布の本質的な特徴を十分に捉えきれない可能性があります。
 この問題に対して、よりすっきりとした視点を与えてくれるのが、今回紹介する キュムラント(cumulant) です。キュムラントは、モーメント母関数を対数変換して得られる量であり、単にモーメントを別の形に並べ替えたものではありません。むしろ、確率分布の加法構造を正確に捉える という重要な性質をもち、これが分布の本質的理解に強い力を発揮します。
 とりわけ注目すべきなのは、正規分布が 3 次以上のすべてのキュムラントをゼロにする唯一の分布である という点です。この性質によって、正規分布はまさに「分布の世界の中心」として位置づけられます。そのため、正規分布が中心に位置する座標系で、そこからのずれを評価する道具としてもキュムラントは使えます。したがって、非ガウス分布の本質的特徴をより深く理解するためには、キュムラントの視点が非常に有効 となります。

0. モーメント母関数

 前回、モーメントとモーメント母関数について説明しましたが、ここでも再度基本の確認をしておきます。ここでは、確率変数 \displaystyle{
X
} が連続分布に従い、その確率密度関数\displaystyle{f_X(x)} とします。このとき、任意の関数 \displaystyle{
g
} に対する期待値は

\displaystyle{
\mathbb{E}[g(X)]
= \int_{-\infty}^{\infty} g(x)\,f_X(x)\,dx
}

で定義されます。ここで、\displaystyle{
g(x)=x^ n
} とすれば、n 次モーメント

\displaystyle{
\mu_n' = \mathbb{E}[X^n] = \int_{-\infty}^{\infty} x^n\, f_X(x)\, dx
}

が与えられます。
 確率密度関数が与えられたとき、モーメント母関数(moment generating function; MGF)は

\displaystyle{
M_X(t) = \mathbb{E}\!\left[e^{tX}\right]
= \int_{-\infty}^{\infty} e^{tx}\,f_X(x)\,dx
}

で定義されます。
 モーメント母関数 M _ X(t) \displaystyle{
n
}微分して \displaystyle{
t=0
} を代入すると、

\displaystyle{
\mathbb{E}[X^n] = \left. \frac{d^n}{dt^n} M_X(t)\right|_{t=0}, 
}

となりますので、 \displaystyle{
n
} 次のモーメントが求められます。
 モーメント母関数を用いると、分布がもつモーメントの情報をすべて取得できます。しかし、モーメントをそのまま確率密度関数の特徴づけに使うには、いくつかの弱点があります。無限次まで計算するのは面倒ですし、データから推定するには、高次のモーメントは不向きです (外れ値の影響を強く受ける)。
 こうした問題を解消し、分布の構造をより明瞭に表現するために導入されるのが、モーメントを再編成した量である「キュムラント」です。

1. キュムラント母関数:対数とってすっきり整理

 キュムラントは、キュムラント母関数(cumulant generating function; CGF) を通して定義されます。キュムラント母関数は、モーメント母関数の対数をとったものであり、

\displaystyle{
K_X(t) = \log M_X(t)
}

と定義されます。
 この関数を \displaystyle{
t=0
} まわりでテイラー展開すると、

\displaystyle{
K_X(t)
= \sum_{n=1}^{\infty} \kappa_n\,\frac{t^n}{n!}
}

となり、展開係数 \displaystyle{
\kappa _ n
} が、\displaystyle{
n
} 次キュムラント(n-th cumulant)です。

■ キュムラントの計算式

 テイラー展開の係数からわかるように、キュムラントはキュムラント母関数を微分し、\displaystyle{
t=0
} を代入するだけで計算できます。つまり、

\displaystyle{
\kappa_n = \left.\frac{d^n}{dt^n} K_X(t)\right|_{t=0}
}

です。

■ キュムラントの例

 代表的な低次のキュムラントは次のようになります。

  • 1 次キュムラント(平均と一致)
\displaystyle{\kappa_1 = \mathbb{E}[X]}

  • 2 次キュムラント(分散と一致)
\displaystyle{\kappa_2 = \mathrm{Var}(X)}

  • 3 次キュムラント(3 次中心モーメント、歪度に関連)
\displaystyle{\kappa_3 = \mathbb{E}\!\left[(X-\mu)^3\right]}

  • 4 次キュムラント(尖度に関連)
\displaystyle{\kappa_4 = \mathbb{E}\!\left[(X-\mu)^4\right] - 3(\mathbb{E}\!\left[(X-\mu)^2\right])^2}

[補足説明:歪度、尖度とは]

 歪度は分布の左右非対称性を表す指標で、3 次中心モーメントを用いて

\displaystyle{
\gamma_1
= \frac{\mathbb{E}\!\left[(X-\mu)^3\right]}{\left(\mathbb{E}\!\left[(X-\mu)^2\right]\right)^{3/2}}
}

と定義されます。

  • \displaystyle{\gamma _ 1\gt0} のときは右裾が長い(右に歪んでいる)分布、

  • \displaystyle{\gamma _ 1\lt0} のときは左裾が長い(左に歪んでいる)分布

を意味します。ただし、歪度の値は外れ値の影響を強く受けるため、分布の中心部分の非対称性を評価する指標としては必ずしも頑健ではありません。
 4 次キュムラントは、4 次中心モーメントから、正規分布で生じる冗長成分 \displaystyle{3\sigma^ 4} を差し引いた形になっています。そのため、正規分布では \kappa_4=0 になります。統計学で一般的に用いられる尖度 \displaystyle{
\gamma _ 2
}(non-excess kurtosis)は、

\displaystyle{
\gamma _ 2 = \frac{\mathbb{E}\!\left[(X-\mu)^4\right]}{\left(\mathbb{E}\!\left[(X-\mu)^2\right]\right)^2}
}

で定義されます。この定義では、正規分布の場合に、\displaystyle{
\gamma _ 2 = 3
} になります。
 また、正規分布において「尖度」が、0 になるように調整した、

\displaystyle{
\gamma_2^{\!*}
= \gamma_2 - 3
= \frac{\mathbb{E}\!\left[(X-\mu)^4\right]}{\sigma^4} - 3
}

を、過剰尖度(excess kurtosis)と呼びます。「尖度」という名称から、分布の尖り具合(ピークの鋭さ)を表しているような印象を受けますが、実際には 外れ値の影響を非常に強く受ける統計量 であり、分布の中心の構造を特徴づけるには必ずしも適切ではありません。

2. キュムラントの性質

 以上のように、キュムラントは、分布の形状を特徴づける基本的な統計量──平均、分散、歪度、尖度──を自然に取り出すことができます。
 さらに、キュムラントには、統計解析で非常に重宝される美しい性質があります。それは、以下の点です。

■ 独立な確率変数の和に対して、キュムラント母関数もキュムラントも和になる

 ここでは、X の n 次キュムラントを \displaystyle{\kappa _ n(X)} と表しすとこにします。もし、X = X_1 + X_2、かつ X_1X_2 が独立なら

\displaystyle{\kappa_n(X) = \kappa_n(X_1) + \kappa_n(X_2)}

という性質が成り立ちます。このことは、そもそも、キュムラント母関数について、

\displaystyle{K_{X} (X) = K_{X_1} (X_1) + K_{X_2} (X_2)}

が成り立つことを意味します。この関係は、畳み込み定理により、確率変数の和のモーメント母関数が積で表されますので、その対数をとったキュムラント母関数が和になるのは当然です。

正規分布では、3 次以上のすべてのキュムラントが 0 になる

 正規分布の場合、

\displaystyle{
\begin{aligned} \kappa_1 &= \mu,\\ \kappa_2 &= \sigma^2,\\ \kappa_3 &= 0 ,\\ \kappa_4  &= 0,\\ \kappa_5 &= 0 \\ &\vdots \end{aligned}
}

となります。つまり、正規分布では3次以上のキュムラントが、すべて0であり、「正規分布が、平均と分散だけで完全に決まる唯一の分布」であるということです。
 これら 2 つの性質を理解しておくことはとても大切で、独立和に対する加法性は、大数の法則中心極限定理の解析を自然にし、高次キュムラントが正規分布で消える性質は、「正規分布が分布の世界の中心にある」と言われる理由を構造的に裏付けるものです。
 以上に加えて、以下の性質も印象に残しておいてください。

■ 定数倍 aX のキュムラント

  aを定数とすれば、

\displaystyle{
\kappa_n(aX) = a^n\, \kappa_n(X), \quad (n=1,2,3,\dots)
}

です。このことは、以下のように確認できます。
 aX のキュムラント母関数を求めます。

\displaystyle{
K_{aX}(t)
= \log \mathbb{E}\big[e^{t (aX)}\big]
= \log \mathbb{E}\big[e^{(at) X}\big]
}

ここで、右辺は「X のキュムラント母関数に at を代入したもの」になっているので、

\displaystyle{
K_{aX}(t) = K_X(at)
}

と書けます。
 あとは、t=0 で、 n微分をとればよいだけです:

\displaystyle{
\kappa_n(aX)
= \left.\frac{d^n}{dt^n} K_{aX}(t)\right|_{t=0}
= \left.\frac{d^n}{dt^n} K_X(at)\right|_{t=0}.

}

ここで合成関数の微分(チェインルール)を考えると、

\displaystyle{
\frac{d^n}{dt^n} K_X(at)
= a^n\, K_X^{(n)}(at)
}

となるので、t=0 を代入して

\displaystyle{
\kappa_n(aX)
= a^n\, K_X^{(n)}(0)
= a^n\, \kappa_n(X)
}

が得られます。

■ シフト X+c のキュムラント

  cを定数とすれば、

\displaystyle{
\begin{aligned}
\kappa_1(X+c) &= \kappa_1(X) + c,\\
\kappa_n(X+c) &= \kappa_n(X) \quad (n \ge 2).
\end{aligned}
}

つまり、「1 次キュムラント(平均)だけが定数分だけずれ、2 次以上のキュムラントは不変」です。このことは、以下のように確認できます。
 まず、X+c のキュムラント母関数を計算します。

\displaystyle{
\begin{aligned}
K_{X+c}(t)
&= \log \mathbb{E}\big[e^{t (X+c)}\big] \\
&= \log \mathbb{E}\big[e^{tX} e^{tc}\big] \\
&= \log \big( e^{tc} \mathbb{E}[e^{tX}] \big) \\
&= \log e^{tc} + \log \mathbb{E}[e^{tX}] \\
&= tc + K_X(t).
\end{aligned}
}

したがって、 \displaystyle{
K_{X+c}(t) = K_X(t) + tc
} となります。あとは、これを t微分して t=0 を代入するだけですので、上の関係式が成り立つことがわかると思います。

3. キュムラントから眺める中心極限定理

 キュムラントの加法性を理解してしまえば、独立同分布に従う確率変数  \{X _ 1, X _ 2, \cdots, X _ n\} の和の振る舞いを簡単にとらえることができます。以下では、 X _ i のキュムラント母関数を \displaystyle{
K _ X(t)
} とし、その n 次のキュムラントを  \kappa_k(X) とします。 Xは、正規分布にしたがわなくても構いませんが (むしろ、非正規分布に従うとします)、 \kappa _ 1(X) = \mu \kappa _ 2(X) = \sigma^ 2 とします。
 まず、独立な確率変数の和

\displaystyle{
S_n = X_1+\cdots+X_n
}

を考えると、そのキュムラント母関数は、

\displaystyle{
K_{S_n}(t)=n K_X(t)
}

です。よって、n 次のキュムラントについて

\displaystyle{
\kappa_k(S_n)=n\,\kappa_k(X)
}

が成り立ちます。さらに標準化

\displaystyle{
Z_n=\frac{S_n-n\mu}{\sqrt{n\sigma^2}}
}

を行うと、キュムラント母関数は、

\displaystyle{
\begin{aligned}
K_{Z_n}(t)
&= K_{\frac{S_n-n\mu}{\sqrt{n\sigma^2}}}(t) \\
&= K_{S_n}\!\left(\frac{t}{\sqrt{n\sigma^2}}\right)+\frac{n\mu}{\sqrt{n\sigma^2}}\,t \\
&= n\,K_X\!\left(\frac{t}{\sqrt{n\sigma^2}}\right)+ \frac{n\mu}{\sqrt{n\sigma^2}}\,t
\end{aligned}
}

となります。あとは、上で示した公式、

\displaystyle{
\kappa_n(aX) = a^n\, \kappa_n(X), \quad (n=1,2,3,\dots)
}

を使えば、

  • 1次キュムラント:0
  • 2次キュムラント:1
  • 3次以上:
\displaystyle{
\kappa_k(Z_n)
=\frac{\kappa_k(X)}{n^{k/2-1}} \quad (k \ge 3)
}

となります。ここで、n \to \infty のとき、

  • \displaystyle{k=3} なら \displaystyle{n^ {-1/2}} に比例して 0 へ収束、
  • \displaystyle{k=3} なら \displaystyle{n^ {-1}} に比例して 0 へ収束、
  • 高次ほど急速に 0 へ収束

することがわかります。
 結果として、標準化された和は、高次キュムラントがすべて消え、最終的に正規分布のキュムラント(1、2 次だけ残る)へ収束することが示されました。
 これが中心極限定理の一つの証明です。

4. まとめ

 キュムラントを知っている学生は少ないので、モーメントの陰に隠れた「脇役」のような印象をもたれがちです。しかし、実際には、確率分布の構造を最も素直に語ってくれる、極めて本質的な存在です。モーメントでは見えにくい「加法性」という性質を自然な形で表現し、分布の中心にある正規分布を明晰に位置づけ、さらに非ガウス性がどれだけ残っているかを定量的に教えてくれます。特に、独立和や標準化といった操作が、キュムラントの世界ではほとんど自動的に整理されるため、確率論の大きな定理さえ、構造を見せるだけで自然に姿を現します。こうして眺めると、キュムラントは決して「脇役」ではなく、むしろ確率分布を理解する舞台の中心に静かに立ち続けていた「主役」だったことがわかります。非ガウス分布を深く理解したいときほど、この視点のありがたさが際立ちます。

※ もし記事の中で「ここ違うよ」という点や気になるところがあれば、気軽に指摘していただけると助かります。質問や「このテーマも取り上げてほしい」といったリクエストも大歓迎です。必ず対応するとは約束できませんが、できるだけ今後の記事で扱いたいと思います。それと、下のはてなブログランキングはあまり信用できる指標ではなさそうですが (私のブログを読んでいる人は、実際とても少ないです)、押してもらえるとシンプルに励みになります。気が向いたときにポチッとしていただけたら嬉しいです。