ケィオスの時系列解析メモランダム

時系列解析、生体情報解析などをやわらかく語ります

医療統計

【Rでt検定】何度でも言う、p値にこだわりすぎるな?! でも、例数を増やす努力はしろ!!

私は大学では、博士号を取得するまでずっと物理学専攻でした。専門は非線形力学系でしたので、学生時代に推測統計を使ったことはありません。その後、研究分野を変えて、生体情報の研究を始めたばかりのころは、「統計検定は、みんな意味もよく分からずに使…

【Rで医療統計】ロジスティック回帰とは:共変量が1つか2つの例

ロジスティック回帰とは? ロジスティック回帰とは、ある出来事が起こる確率を予測するための統計モデル です。たとえば、次のような予測をしたいとします: ある人が肺がんになるかどうか(「なる」か「ならない」) 送られてきたメールがスパムかどうか(…

p値って何なの?:もう「統計的に有意」とは言わないで

統計を使った結果を論文にまとめるとき、p値 (p-value)をとにかく重視する、p値信仰とも呼べる重苦しい呪縛を感じることがあります。研究論文で「p < 0.05 で有意でした」なんてフレーズを見るのは日常茶飯事です。しかし、「p値って何?」と聞かれて、みん…

【Rでsurvival】Kaplan-Meier曲線推定とログランク検定

今回は、Rのsurvivalパッケージを用いて、Kaplan-Meier曲線の推定とログランク検定を行う方法について説明します。生存時間解析は、たとえばある集団において「ある時点まで生存している確率」を求めたり、異なるグループ間で生存状況に差があるかどうかを検…

【Rで生存時間シミュレーション】生存時間解析用の数値データの生成

最近では、さまざまな統計解析がパッケージや生成AIを使うことで手軽に実行できるようになりました。そのため、「とにかく結果が出れば良い」という考えが強くなり、解析手法の本質を十分に理解せずに使われることも多いのではないでしょうか。 私自身は、理…

【生存時間解析入門】Cox比例ハザードモデル:何でハザード?

Cox比例ハザードモデル(Cox Proportional Hazards Model)は、生存時間解析の代表的な方法の一つです。このモデルの主な目的は、ある要因が、イベントの発生率にどのような影響を与えるかを評価することです。ここで考えるイベントは、死亡、病気の発症など…

【Rで生存時間解析】Kaplan-Meier (カプラン・マイヤー)法による生存曲線の推定

Kaplan-Meier (カプラン・マイヤー)法は、生存曲線 (survival curve)、あるいは、生存関数と呼ばれる、生存確率の推移を推定するための方法です。生存曲線は、時刻ゼロで全員が生きていた状態から出発し、時間の経過とともに、残念ながら、亡くなってしまう…

ROC解析について説明してみる

ROC解析の説明では,分割表を使った説明が多くあります.インターネットで検索したり,ChatGPTなどに質問すれば,わかりやすい説明が出てきます.しかし,ここでは分割表は使わずに,検査スコアのばらつきを見ながら,ROC曲線の説明をしてみます. 陽性と陰…

ROC解析の説明用動画(その2)

今回は,データからROC曲線を求める場合の説明動画です. 下の図 (gifアニメ)の上段では,カットオフの位置を変えたときの TN:真陰性(True negative) FP:偽陽性(False positive) FN:偽陰性(False negative) TP:真陽性(True positive) の例数,お…

ROC解析の説明用動画(その1)

学生が発表用スライドでROC解析を説明していたので,ROC解析の説明用の動画を作りました.ここに置いてあるものは解像度が低いですが,自由に使ってください.以下の記事も参考にしてください. chaos-kiyono.hatenablog.com ROC解析とは インターネット上に…