ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【時系列解析の基礎】「弱定常」中心主義:「実世界の要請」ではなく「数学的理想化」

時系列解析のほとんどの教科書では、「弱定常(weak stationarity、weak-sense stationarity)」という概念が、解析の前提条件として導入されます。この前提を理解することは、理論的枠組みを整理し、数理的な議論を追ううえでは確かに有用です。しかし、実…

【Rで統計】R で ANOVA(分散分析)への最短ルート

ANOVA(分散分析)は、複数グループの平均に差があるかどうかを一度に判定するための手法です。本来は前提条件や理論的背景を理解した上で使うべき解析ですが、ここではそれを一切扱いません。 この解説の目的はただ一つです。「最短手順で、解析結果を出す…

【Rで統計】ANOVAでは帰無仮説が正しくても有意差は出現する:p値だけでなく効果量を見る

統計検定を使う全員に知っておいてほしいこと、それは帰無仮説が正しい、あるいは、群間に差がないとき、p値は一様分布に従うということです。これは直感に反するかもしれませんが、非常に重要な性質です。つまり、本当はまったく差がなくても、p値が0.999に…

【Rで統計】分散分析ANOVAの考え方:データのばらつきの要因の分解

実験や観測データの解析では「複数の群(グループ)の平均値に差があるか」 を知りたいことが頻繁にあります。たとえば、 3 種類の薬 A、B、C の効果の違い 複数条件下での生理指標の差 学年・群・処理条件ごとの測定値の比較 などです。 そのような多群比較…

【Rで非ガウス統計5】間欠性ゆらぎと局所和の正規分布への遅い収束:多重スケール確率分布解析(その2)

今回から、間欠性(Intermittency)、あるいは 分散不均一性(Heteroscedasticity) と呼ばれる性質をもつ非ガウス時系列を対象に、多重スケール確率分布解析を用いて評価する実務的な方法を解説していきます。 ここで扱う時系列は、対数正規カスケード過程…

【科学の言葉を知る7】バタフライエフェクト:現象の名前としての「カオス」

「ティラノサウルスは決まったパターンやスケジュールには従わない。そこにカオスの本質がある。」 —映画 Jurassic Park(1993)で、数学者イアン・マルコム博士(Ian Malcolm)は、そう断言します。彼は、手の甲に垂らした水滴が、落とすたびに流れ落ちる方…

【Rで線形混合モデル3】なぜ個人差を考慮する必要があるのか

生体信号解析、心理実験、行動データ、教育データなど、同じ実験対象者から複数回の測定を行った結果のデータは多くの分野で扱われています。そのようなデータに対して「実験対象者間の個人差はとりあえず無視して、全部まとめて回帰してみよう」と考えるか…

【Rで非ガウス統計4】間欠性 (Intermittency)と分散不均一性 (Heteroscedasticity):多重スケール確率分布解析(その1)

私たちは日常の中で、「変化の少ない期間が続いたかと思うと、突然、大きな変動が立て続けに起こる」という経験をすることがあります。静かな天気が続いていたのに、急に激しい嵐に見舞われることもあれば、株式市場が落ち着いていると思っていた矢先に、あ…

【Rで非ガウス統計3】相乗対数正規モデルのパラメタ推定:モーメント法

乱流、株式指標、心拍ゆらぎなどの時系列では、その確率分布が正規分布に比べて裾の厚い非ガウス性を示すことがよくあります。今回は、そのような非ガウス分布を記述するモデルとして、Castaing が発達乱流の記述のために提案した相乗対数正規モデルを導入し…

【Rでスペクトル解析3】パワースペクトル推定法のノンパラメトリックとパラメトリック

有限長の離散時系列データからパワースペクトル(Power Spectral Density: PSD)を推定する方法は、大きく ノンパラメトリック法 と パラメトリック法 に分けることができます。 ノンパラメトリック法では、時系列データに特定の確率モデルを仮定せず、時系…