ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

2026-01-01から1年間の記事一覧

【成長データ解析の基礎と再考 (3)】成長曲線推定法はパラメトリックなLMS法だけじゃない:Quantile regressionでやってみる。

子どもの身長や体重の成長曲線を推定する手法としてはLMS法が最も有名であり、近年ではその発展形であるGAMLSS(Generalized Additive Model for Location, Scale and Shape)が主流となっています。しかし、成長曲線の推定アプローチはLMS法だけではありま…

【成長データ解析の基礎と再考 (2)】誰でも簡単、成長曲線推定:シミュレーションデータでやってみるLMS法

今回は、LMS法を使って実際に成長曲線を推定してみます。 子どもの身長や体重の評価では、「同じ年齢の子どもたちの中で、その子がどの位置にいるか」を示すパーセンタイル(centile)が広く用いられます。たとえば、「50パーセンタイル」であれば同年齢の子…

【成長データ解析の基礎と再考 (1)】LMS法(Lambda-Mu-Sigma method)とは何か:身長・体重・BMIの成長曲線を支えてきた統計モデル

今回は、下図のような身長や体重の成長曲線の推定についてのお話です。 Figure: 成長曲線の例。この生存曲線を描くRスクリプトは、記事の最後に掲載してあります。 余談ですが、最近、医学・生理学の分野で気になることがあります。数理的な手法が、いつの間…

BioMecForum 第113回研究会 開催のご案内:「聞こえているのに、聞き取れない」その悩み、研究の最前線へ

以下の研究会のご案内です。 BioMecForum 第113回研究会 テーマ:聴覚障害の理解と支援に向けた医学・工学の連携 日時:2026年3月14日(土)13:30〜17:00 場所:大阪大学 基礎工学部 国際棟 Σホール(ハイブリッド開催) アクセス | 大阪大学 基礎工学部 / …

「仮説検証型研究」と「探索的データ分析」を混同してはいけない:「統計検定で有意差あり」がゴールじゃない

「統計的に有意な結果が出た」——この決め台詞は多くの論文で使われ、一見すると強力な証拠を意味しているように聞こえます。しかし実際には、どのような手順で分析が行われたのかによって、同じ「有意差あり」という主張でも、信頼できる発見にもなれば、単…

AI時代でも知っておくべき「論文執筆の基本」(4):感覚的な日本語読点「、」とルールに従う英語コンマ「,」

私が大学院生のとき、日本語で論文や解説を書く中で、強く気になった点が二つありました。一つは、日本語の読点「、」の正しい使い方がよく分からなかったことです。もし「、」の打ち方に明確なルールがあるのなら、正しく使いたいと思いました。 もう一つは…

AI時代でも知っておくべき「論文執筆の基本」(3):文の頭と尻尾に必然を与える information structure

これまで「論文執筆の基本」として、signposting(道しるべ)によって読者に「今どこにいて、これからどこへ向かうのか」を明示すること、また parallelism(並列性)によって文や節の形をそろえ、読み手が無意識のうちに理解を進められる文章構造をつくるこ…

AI時代でも知っておくべき「論文執筆の基本」(2):構造をそろえる Parallelism というリズム

生成AIが文章を生成してくれる時代になり、「書く」という行為の価値は、以前とはかなり違って感じられるようになりました。そうであっても、あなたが論文を書くときに知っておくべき基本は、今なお変わらず存在しています。今回の記事では、科学技術論文の…

【Rで長時間相互相関解析】Detrending Moving-Average Cross-Correlation Analysis(DMCA)とは何か:隠れた共通成分を検出

Detrending Moving-Average Algorithm、あるいは Detrending Moving-Average Analysis はDMAと略され、1 本の時系列における長時間自己相関や自己アフィン性を評価するための解析手法です。それに対して、Detrending Moving-Average Cross-Correlation Analy…

AI時代でも知っておくべき「論文執筆の基本」(1):道しるべを示すsignpostingへの意識

生成AIが論文執筆を手伝ってくれる時代になりました。膨大な情報を一瞬で集め、要約し、もっともらしい文章を生成する。その能力に対して、私は便利さ以上に、正直なところ恐怖を感じることがあります。それは、私が30年かけて積み上げてきた知識や訓練が、…

【科学の言葉を知る8】次元 :単位と変数の数から「測る」という概念へ

子どもがドラえもんの「4次元ポケット」に、どこか不思議で奥深い世界を感じるように「次元」という言葉には、身近でありながら正体のつかみにくい響きがあります。私たちはこの言葉を当たり前のように使っていますが、改めて考えると、その意味をはっきり説…

コッホ曲線の物語:数学的創造物からフラクタルのアイコンへ

19世紀後半まで、数学者の多くは「連続な曲線は、ほとんどの点で滑らかに接線が引ける」という幾何学的直感を、半ば当然のものとして受け入れていました。ところが、この直感は19世紀末に大きく揺さぶられます。 Karl Weierstrass は 1872年、いたるところ連…

【自由に使って】コッホ(Koch)曲線の拡大アニメーション

コッホ曲線(Koch curve)の自己相似性を説明するためのGIFアニメーションを作りました。引用なしで自由にコピーして使って構いません。 Figure: コッホ(Koch)曲線の部分を拡大すると全体と一致する。 この画像は、下図の非整数ブラウン運動と対比させるた…

方向特異的なフラクタル変動の検出と分解:Oriented Fractal Scaling Component Analysis

2次元平面内を、時間とともにふらふらと動く点の軌跡、すなわち 2次元軌道 を考えます。たとえば、静止立位時の足圧中心(center of pressure: CoP)のゆらぎ(下図)、視覚固視中に生じる眼球の微小な揺らぎ、あるいは画面上でのポインタやカーソルの動きな…

有限幅のゆらぎか、広がり続けるゆらぎか、そして、その境界としての 1/f ノイズ

型のパワースペクトルと一口に言っても、指数 の値によって、その統計的・物理的性質は大きく異なります。教科書や論文で典型的に議論されるのは、概ね 程度の範囲であり、この範囲で、弱定常過程、ホワイトノイズ・非整数ガウスノイズ(fractional Gaussian…

【フラクタル時系列解析の基礎】理想と現実のあいだで考えるフラクタルゆらぎ:ブラウン運動と非整数ブラウン運動

ブラウン運動と非整数ブラウン運動(fractional Brownian motion)について、しっかり理解したい人向けに、基礎の基礎から説明してみたいと思います。 1. 生物学者ブラウンの発見から、数学的ブラウン運動へ 2. 実世界で観測した時系列は「離散的」 3. 理想…

【統計・時系列解析の基礎としての行列1】行列表現・線形代数が何の役に立つのか?

近年、統計解析や時系列解析は、多くの分野で「道具」として広く使われるようになっています。その一方で、そのような手法がどのような構造を仮定し、何を計算しているのかを十分に理解しないまま使っている学生や実務者が増えているとも感じます。統計や時…

【Rでブラインド音源分離】Second-Order Blind Identification(SOBI)入門

複数のセンサで観測した信号が、実は複数の独立した「音源」の混合であった、という状況は、信号処理の分野ではよく見られます。そのような問題は ブラインド音源分離(Blind Source Separation, BSS) と呼ばれます。 BSS の代表的な手法としては ICA(Inde…

【Rで瞬時周波数推定】Savitzky–Golay微分フィルタを用いたTeager–Kaiser Energy Methodの改善策

瞬時周波数や振幅を同時に推定できる TKEO(Teager–Kaiser Energy Operator) は、振幅変調・周波数変調(AM–FM)信号解析の古典的な手法です。しかし、実データへの適用を考えると、従来の TKEO 法には明確な問題があります。ごくわずかな加法ノイズが含ま…

【Rで瞬時周波数推定】意外と単純 Teager–Kaiser Energy Method:ヒルベルト変換じゃないよ

振動する時系列信号を解析するとき、私たちはしばしば「この信号は、いまどれくらいの強さで振動しているのか」「振動の速さは時間とともにどう変わっているのか」といった問いを立てます。Teager–Kaiser energy operator(TKEO)は、まさにそのような問いに…

【Rで波素分析】ARパワースペクトルを1次と2次のAR成分に分解してみる

以前説明した「自己回帰 (AR)パワースペクトルの分解:波素分析」(詳細は以下のリンク参照) 自己回帰 (AR)パワースペクトルの分解:波素分析 - ケィオスの時系列解析メモランダム をRで実際にやってみようという記事です。ARスペクトル分解(波素分析)は…

【Cで高速DMA】長いデータでは畳み込みDMAアルゴリズムは遅すぎる:高速アルゴリズムで解決

今回はC言語プログラムを使って、DMA(Detrending Moving Average Analysis)の高速アルゴリズムの処理速度が如何に速いかを見てみます。素朴に Savitzky-Golay フィルタの畳み込みを計算をする DMA アルゴリズムと、我々のグループが提案している高速DMAア…

【Cで高速DMA】長時間相関解析で、みんなに使ってほしい

時系列の長時間相関(スケーリング)を調べるとき、トレンド除去を含む detrended moving-average analysis (DMA) は、DFA の次に良く使われている手法です。実は、DMAには、DFAよりも優れた部分が複数あり、上位互換と言える方法です。しかし、知名度(主に…

【RでDMA】高速アルゴリズム [PHYSICAL REVIEW E 93, 053304 (2016)]

長時間相関(long-range correlation)や 1/f スケーリングの解析では、トレンドを含む非定常時系列から「本来のゆらぎ」を取り出すために、Detrended Fluctuation Analysis(DFA) や Detrended Moving Average Algorithm (DMA) のような、トレンドからの偏…

【時系列解析の基礎】「弱定常性」「線形性」「ガウス性」は同じ?似ている?それとも別物?

時系列解析の入門書や講義、あるいは時系列解析に関連した論文では、弱定常性(weak stationarity)、線形性(linearity)、ガウス性(Gaussianity)といった言葉が頻繁に登場します。しかし、時系列解析の応用がさまざまな分野へと広がるにつれて、これらの…

【時系列解析の基礎】「弱定常」中心主義:「実世界の要請」ではなく「数学的理想化」

時系列解析のほとんどの教科書では、「弱定常(weak stationarity、weak-sense stationarity)」という概念が、解析の前提条件として導入されます。この前提を理解することは、理論的枠組みを整理し、数理的な議論を追ううえでは確かに有用です。しかし、実…

【Rで統計】R で ANOVA(分散分析)への最短ルート

ANOVA(分散分析)は、複数グループの平均に差があるかどうかを一度に判定するための手法です。本来は前提条件や理論的背景を理解した上で使うべき解析ですが、ここではそれを一切扱いません。 この解説の目的はただ一つです。「最短手順で、解析結果を出す…

【Rで統計】ANOVAでは帰無仮説が正しくても有意差は出現する:p値だけでなく効果量を見る

統計検定を使う全員に知っておいてほしいこと、それは帰無仮説が正しい、あるいは、群間に差がないとき、p値は一様分布に従うということです。これは直感に反するかもしれませんが、非常に重要な性質です。つまり、本当はまったく差がなくても、p値が0.999に…

【Rで統計】分散分析ANOVAの考え方:データのばらつきの要因の分解

実験や観測データの解析では「複数の群(グループ)の平均値に差があるか」 を知りたいことが頻繁にあります。たとえば、 3 種類の薬 A、B、C の効果の違い 複数条件下での生理指標の差 学年・群・処理条件ごとの測定値の比較 などです。 そのような多群比較…

【Rで非ガウス統計5】間欠性ゆらぎと局所和の正規分布への遅い収束:多重スケール確率分布解析(その2)

今回から、間欠性(Intermittency)、あるいは 分散不均一性(Heteroscedasticity) と呼ばれる性質をもつ非ガウス時系列を対象に、多重スケール確率分布解析を用いて評価する実務的な方法を解説していきます。 ここで扱う時系列は、対数正規カスケード過程…