多変量解析とは|ロジスティック回帰分析など解析方法をシンプルに解説

研修医・若手医師

多変量解析について勉強をしたいけど、本を読んでも数式がいっぱい出てきて心が折れそうになったことありませんか?

僕もそうでした。

ここでは数式を一切使いません

・論文を読んでいてロジスティック回帰分析ってのが出てきたけどなんのこと?
・論文を書こうとしているけど、どの解析方法を使ったらいいの?

という人向けに

・多変量解析とは何か
・どんな時にどの解析方法を使うべきか

をシンプルに解説します。

時間が無い方は目次の2番目だけ見てもらうだけでも役に立つはずです。

多変量解析とは

多変量解析とは、複数の要因が結果に与える影響を分析する方法です。

具体例を挙げると、ある薬を投与したA群と、投与しなかったB群とで後ろ向きに死亡率を比較するとします。

単純に比較する(単変量解析)と、カイ二乗検定を行うことになります。

結果はA群が死亡率15%、B群が死亡率25%で有意差がありました。

ではこの薬は効果がある、と結論づけられるでしょうか?

これがランダム化比較試験(RCT)であればそれで問題ない可能性が高いのですが、後ろ向き研究では事情が全く異なります。

なぜなら死亡率というアウトカムには薬の投与以外にも複数の要因が影響を与えている可能性が高いからです。

年齢、重症度、合併症(糖尿病、腎不全など)の有無、などによって死亡率は影響を受けます。

このB群の方が年齢が高い、重症度が高い、糖尿病を持つ人の割合が高い、となればそれだけで死亡率が上がってしまうわけです。

この影響を分析することで、できるだけフェアな比較をすることを可能にするのが多変量解析なのです。

なぜRCTなら単純に比較できるの?と思った人は、ランダム化比較試験(RCT)とは|RCTの3つの利点を解説、の記事もよければ参考にしてください。

解析方法が一目でわかる表

表の左側が結果変数(研究のアウトカム)を表しており、それぞれの単変量解析、多変量解析の方法を対応させています。

連続変数の多変量解析:重回帰分析

連続変数はt検定を用いてその平均値の差を比較します。

正規分布、平均値と中央値、t検定とMann-WhitneyのU検定については別記事で解説しているので参考にしてください。

連続変数を複数の要因で分析する場合は重回帰分析を用います。

カテゴリー変数の多変量解析:ロジスティック回帰分析

医学論文ではイベント発生率(死亡や合併症の発生)をアウトカムにすることが多いので重回帰分析が用いられることは多くありません。

例えば、クラスの平均点の差を性別・運動部か文化部か・塾へ行っているかどうか、などの複数の要因で分析する場合などは重回帰分析をすることになります。

死亡率などのイベント発生率はカテゴリー変数(あり・なしで表せるもの)なので多変量解析ではロジスティック回帰分析を用います。

生存分析の多変量解析:Cox比例ハザード回帰分析

生存分析は生存日数を結果変数としてカプランマイヤー曲線と呼ばれる図を描くものです。

それをログランクテストという方法で曲線に差があるかを検定するのが一般的です。

この生存日数において複数の要因を同時に解析するのがCox比例ハザード回帰分析です。

まとめ

多変量解析の各種解析方法について数式を使わずに解説しました。

解析方法の名前はややこしいですが、表で整理してしまうと以外とシンプルです。

この表を頭に入れて、論文を読んだり、データ解析を実践していきましょう。

もしよかったら統計に関する関連記事も合わせて読んでみてください。

ランダム化比較試験(RCT)とは|RCTの3つの利点を解説

2020年3月12日

t検定とMann–WhitneyのU検定|医学論文を読む・書くに必要な統計の基礎知識を数式を使わず解説①

2020年3月5日

サンプルサイズとは?医学論文を読むための統計知識を数式無しで解説

2020年2月13日