ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

【R】複数のp値をまとめて一つに:Fisherの結合確率検定 Fisher's Combined Probability Test

交差検証(クロスバリデーション)などで得られえた複数の 値をまとめて一つにして表したい場合があります。あるいは、「メタアナリシスで複数の研究結果を統合して「効果があるかどうか」を知りたい 」とか、 「複数の測定方法や実験条件の結果をまとめて評…

生命の不思議に挑む生物・生体工学:大学院生進学のお誘い

生物・生体・生命は、不思議な現象に満ちあふれています。ヒトを含む動物や植物、細菌など、すべての生物は細胞の核内にDNAを持ち、そのDNAに含まれる遺伝情報が、生物の成長の過程や形態、生き方を決定しています。 また、ヒトの脳には約860億個もの神経細…

1/fゆらぎの自己相関関数は対数減衰:自己相関はpower lawじゃない

1/fゆらぎ (1/f雑音、フリッカーノイズとも呼ばれます)は、自然界や複雑なシステムに広く観測されるゆらぎの特性です。この雑音は、電気回路、経済データ、生体信号、交通流、さらには音楽や芸術にも現れることが知られており、非常に多様な現象と関係してい…

長期記憶過程の自己相関関数とパワースペクトルのスケーリング関係:解析的導出

今回は、長期記憶過程の自己相関関数とパワースペクトルのスケーリング指数の関係について説明します。学生から、導出できないという相談がときどきあるので、やや詳しく書いておきます。連続近似して積分したほうが計算は楽ですが、できるだけ離散の形でで…

【Rで統計入門】(8) スチューデントのt分布:スチューデントはゴセットのペンネーム

スチューデント (Student)のt分布は、統計学において小さなサンプルサイズで母集団の平均を推定する際に重要な役割を果たします。この分布の発見は、イギリスの統計学者ウィリアム・シーリー・ゴセット(William Sealy Gosset)の業績によるものです。 この…

【Rでコピペでパス指定】Windows環境でエスケープ文字"\"をエスケープ:裏技、raw stringリテラル

Windowsのファイルパスではディレクトリ区切りに、バックスラッシュ「\」、あるいは、日本語環境では円マーク「¥」が使われます。一方、Rの文字列ではバックスラッシュ「\」はエスケープ文字として扱われるため、文字として「\」を表示したい場合は、「\」…

【Rで統計入門】(7) 推定量とは:分散の推定量の仲間たち

私たちがデータを統計的に処理するとき、そのデータの背後にある真の構造 (特徴や分布など) を見つけたいと考えます。たとえば、以下のような場合です。 選挙の結果を予測するために、一部の人の投票を出口調査して全体の傾向を推測する。 製品の不良品発生…

【RでEMD】経験的モード分解 Empirical Mode Decomposition

Empirical Mode Decomposition(EMD、経験的モード分解)は、時系列データをヒルベルト変換で扱いやすい振動成分に分解する方法です。ヒルベルト変換については,以下の記事も参考にしてください. 【Rで時系列解析】ヒルベルト変換で振動のエンベロープを抽…

【Rで統計入門】(6) 確率変数:大文字と小文字の使い分け

確率変数という言葉は、統計学や時系列解析を学ぶときによく登場します。今回は、確率変数の基本的な表記方法や定義、期待値の計算についてのお話です。 確率変数とは 確率変数の種類 離散確率変数 離散確率変数の例1:コインを投げる場合 離散確率変数の例2…

【Rで統計入門】(5) 確率の難所、確率空間とσ-加法族:確率の入り口であきらめないで

確率を勉強しようと意気込んで専門書を開いたものの、いきなり「確率空間」や「測度」、そして「σ-加法族 (しぐまかほうぞく)」といった謎の用語が出てきて、まるで呪文を読まされているような気分になったことが、私にはあります。「よし、確率を理解するぞ…