0から始めるすずめの統計学

統計学を0から始めたい方向け。

生存時間分析【No.1生存時間分析とは】

目次

はじめに

生存時間分析についての課題に取り組みましたが,生存時間分析について取り上げている記事は少なく,調べるのにかなり骨が折れました...そこで自分が生存時間分析について分かっていることをまとめ,後に勉強を進める人にとって少しでも手助けができればいいと思っています.

(※統計解析ソフトはRを用いていて解説していきます.)

 

生存時間分析とは..?

1.おおざっぱに説明

例えば,同じ疾病※にかかった患者さん4人を集めたとする.2人は従来通りの治療,2人は新薬を投与したとする.結果的に全員死亡してしまいましたが,新薬を投与した患者さんは従来通り治療をした患者さんよりも長生きしました.

では,この2つの群に本当に違いがあるのでしょうか...?

 

疾病(しっぺい)と疾患(しっかん)の違いとは・・?

疾病とは・・・病気,健康とは言えない様々な症状・症候を示す病的状態.

疾患とは・・・病気,原因・経過・予後・治療法などがだいたいわかっている病的状態.

☞つまり,疾患の方が具体的な症状や治療法がはっきりしている.

 

          

                

        そのための統計分析が...

         生存時間分析(解析)

 

2.生存時間分析の定義

 生存時間分析 (survival analysis) は、イベント (event) が起きるまでの時間とイベントとの間の関係に焦点を当てる分析方法である.

 

基本概念を確認しよう

イベント(event)とは...?

医療分野👉疾患の再発や死亡など

工学分野👉機械システムや製品の故障など

このような故障,破壊,倒産,再発,死亡などを「イベント(event)」と呼ぶ.

(教科書,参考書によってはエンドポイント(endpoint)/アウトカム(outcome)とも呼ばれる.)

この記事の中では医療分野について考えていきます.

※イベントのことをfailureとも呼ぶことがあります.それは興味のあるイベントとは通常,死亡,疫病の発症などネガティブな体験だからです.

 

臨床試験の生存時間は「いつから」...?

疾患が発生した時点

→明瞭な自覚症状が疾患では可能であるが、糖尿病やがんなどでは難しい.​

診断日

→診断記録から明確に定めることができるが、患者によって疾患の進行状況が異なる可能性がある.​

ランダム化実施時点

→症例登録を行い、治療法の割り付けを行った時点を起算日とするのが通例.​

治療開始時点

→治療の効果を知りたい場合はこれが主流と考えられている. 

打ち切りとは

研究終了時までにイベントが起こらなかった場合のこと.

たとえば,設けられた期間内に死亡(イベント)しなかった.

途中で退院したり,患者さんが逃げ出してその後について追跡できなかったり...

 

生存時間の分類

1.ノンパラメトリックモデル  (non-parametric model)

共変量※を導入しない,分布を仮定しない​.

2.セミノンパラメトリックモデル/セミパラメトリック  (semi-non-parametric model)

→共変量を導入する,分布を仮定しない.​

3.パラメトリックモデル  (parametric model)

→共変量を導入する,分布を仮定する

共変量とは..?

結果と共に変わる原因と思われる変量​(ここでは、性別・年齢・投薬の有無など​時間以外の説明変数として捉える。)

 

もっとわかりやすくいうと...

例えば,Aさんの体重を知りたいとする.体重は,身長,腹囲,胸囲などから予測できる.よって,

Aさんの体重(kg)= α₁×身長 + α₂×腹囲 + α₃×胸囲 + α₀(αiは定数)

 

このようにAさんの体重(目的変数)を説明するような身長,腹囲,胸囲のことを共変量(説明変数)という.詳しくは,回帰分析を検索してみてください.

 

そして,ノンパラメトリックセミノンパラメトリックパラメトリックはそれぞれの特徴別に検定の仕方が異なります.​

ノンパラメトリックは共変量,分布を仮定しないのでログランク検定.​

セミノンパラメトリックは,共変量を仮定し,分布を仮定しないのでCoxハザードモデル.

パラメトリックは分布を仮定して評価していきます.​その具体的な解析方法を次の記事から説明していきます.​

参考文献

☞Rによる分析が載っていますが,咀嚼には少々時間がかかりました..

 

☞分かりやすくてかなりおすすめです🙈🙈