IPWや傾向スコアは使わなくてよい
Good Morning!
最近の臨床研究は統計手法が高度化してきています。傾向スコアマッチングなど序の口で、機械学習やInverse probability weighting (IPW)などもよく用いられます。
しかし、その「発展的な統計手法」、本当に必要でしょうか。
この記事では多変量解析、傾向スコアマッチング、IPWにフォーカスして、それらの使い道を紹介していきます。
このメルマガは臨床・疫学研究の役に立つ記事を、週一回無料で配信しています。
気に入ったら是非購読ください!
その統計手法はなんのため?
観察研究に限らずどんな研究においても、さまざまな統計手法が用いられます。
まず第一は、それらの統計手法が何のために用いられているかを理解することにあります。
例えば観察研究でのバイアスの一つの要因は、交絡です。交絡を調整する方法がいくつかありますが、最もスタンダードなのは回帰モデルに交絡因子をいれて「調整」する、多変量解析。これが何のためかというと、交絡因子の状態が同じであったと仮定した時の治療効果をみています。
よりファンシーな方法に、傾向スコアマッチングがありますね。これは治療の割り振りの確率が同じもの同士をマッチングすることで、ランダム化試験のような状況を作り出す方法です。ですが、これも交絡因子を調整する方法です。
もっといえば、傾向スコアの使い方は、マッチングだけではありません。傾向スコアの逆数を使って重みづけを行えば、これまた交絡因子が調整できてしまいます。これをIPWといったりしますが、交絡因子を調整する方法の一つです。
ポイントは、どれも交絡因子を調整する方法だということ。
こんなに色々あって、何がおいしいんでしょうか?
基本的には多変量解析でよい
結論から言えば、基本的には多変量解析でよい、となります。これを説明します。
実際、それぞれの手法には一長一短があります。短所をとりあげると:
・多変量解析は、交絡因子間や交絡因子と治療の交互作用が捉えにくいです(interaction termを入れる必要があります)
・傾向スコアマッチングは、マッチングされた集団がどのような集団なのか説明することができません
・IPWは、重みづけの方法によっては、一人が1000人分にもなってしまい、信頼できる結果が得られないことがあります
・傾向スコアマッチングとIPWは、傾向スコアモデルの性能によります。基本的にはロジスティック回帰でなく機械学習がよいとされています。
はっきり言って、もっとも安全に信頼性高く使えるのは、多変量解析です。ですので、交絡因子の調整については、多変量解析でお願いします。
傾向スコアが必要な状況はあるが限定的
他の方法が全く用途がないかというとそんなことはないのですが、状況が限定的です。
・傾向スコアマッチングは、マッチングしたしないとそのあとの解析ができない場合には必要です。そういう状況はなくはないですが、あまりないです
・IPWは時間依存性交絡の調整の場合に必要です。しかしこの手法は発展的で、色々と考えなければならないことが多く、専門的なトレーニングなし使用することは勧められません。
なお、観察研究(だけでなくランダム化試験もですが)で考えなければいけない問題は交絡因子だけではありません。その話題はまたいつか紹介します。
まとめ
交絡因子の調整については、基本的には多変量解析を使っていればOKです。
色々統計手法はありますが、何の目的でどのような仮定をおいて使っているか、意識できるようになるとベターです。
役に立ったら、是非購読・拡散お願いいたします😃
ではまた!