Review: VanderWeele, Tyler J., 2019, Principles of
Confounder Selection, European Journal of
Epidemiology, 34(3): 211–219.
社会科学方法論研究会 4 月例会
Jaehyun Song
早稲田大学 高等研究所
2019 年 4 月 23 日
概要
観察データを用いた因果推論における共変量選択基準
既存の方法の限界
1 Pretreatment criterion
2 Common cause approach
3 Statistical confounder selection
Modified disjunctive cause criterion のすゝめ
Song (Waseda WIAS) Confounder Selection 2019/04/23 1 / 21
Notation and Definitions
A: 処置 (exposure)
Y: 結果 (outcome)
Ya: A = a を受けた場合の潜在的結果
C: Weak ignorability を満たすための、観察された共変量
Weak ignorability を前提
C を統制すれば A と Ya は独立
Ya ⊥ A|C
処置 A の因果効果は
E[Y1 −Y0|c] = E[Y|A = 1,c]−E[Y|A = 0,c]
Song (Waseda WIAS) Confounder Selection 2019/04/23 2 / 21
方法 1: Pretretment Criterion (PC)
処置前に測定された変数を投入
U2
 
L A Y
U1
?? GG
U は観察されていない要因
この基準だと L は統制すべき
しかし、A–U1–L–U2–Y のバックドアが開かれ、バイアスが発生
⇒ M-bias
A と Y の関係を見るには、共変量は不要
Song (Waseda WIAS) Confounder Selection 2019/04/23 3 / 21
M-bias
N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig2.R)
U2
2

−2

εL
// L A Y εY
oo
U1
1
??
2
GG
εA
OO
共変量なしモデル ( ˆY = α + β ·A)
β = −0.035 (p = 0.248)
共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·L)
γ1 = 0.479 (p  0.001)
Song (Waseda WIAS) Confounder Selection 2019/04/23 4 / 21
M-bias を避けるためには
L を統制しなければ問題なし
そのためには因果ダイアグラム内の共変量間の関係に関してほぼ完
全な知識が必要
⇒ 現実的ではない
Song (Waseda WIAS) Confounder Selection 2019/04/23 5 / 21
方法 2: Common Cause Approach (CCA)
処置変数と結果変数、両方に影響を与える処置前変数を投入
U //
##
C // A // Y
A と Y 間の変数のみに限定されるため、PC より少ない情報で ⃝
A と Y 両方の原因となる変数が ˙全 ˙て特定できれば、処置効果の推定
が可能
U は観察済みであり、C は Y の直接の原因ではないため、統制すべ
きではない
しかし ...
Song (Waseda WIAS) Confounder Selection 2019/04/23 6 / 21
CCA の限界
N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig3.R)
U
2 //
5
$$
C
3 // A
4 // Y
εC
OO
εA
OO
εY
OO
共変量なしモデル ( ˆY = α + β ·A)
β = 4.809 (p  0.001)
共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·C)
γ1 = 3.900 (p  0.001)
⇒ C は common cause ではないが、統制した方が良い
Song (Waseda WIAS) Confounder Selection 2019/04/23 7 / 21
両基準の比較
Pretretment Criterion
基準を満たす共変量を統制することによってバイアスが発生
too liberal
Common Cause Approach
基準を満たさない共変量を統制しないことによってバイアスが発生
too conservative
Song (Waseda WIAS) Confounder Selection 2019/04/23 8 / 21
方法 3: Disjunctive Cause Criterion (DCC)
処置と結果、どちらか、あるいは両方を引き起こす変数を統制
Fig.2 の例
PC: L は A の処置前変数なので統制 ⃝ → バイアス ⃝
DCC: L は A を引き起こさないので統制 × → バイアス ×
Fig.3 の例
CCA: C は Y を引き起こさないため統制 × → バイアス ⃝
DCC: L は A を引き起こすので統制 ⃝ → バイアス ×
因果ダイアグラム内の変数が全て揃っているとしても、既存の 2 つ
の方法はバイアスが生じうる
⇔ 因果ダイアグラム内の変数が全て揃っている場合、DCC はバイアス
を最小化する
Song (Waseda WIAS) Confounder Selection 2019/04/23 9 / 21
Z-bias
DCC も万能ではない
U
 
Z // A // Y
DCC によると、Z は統制すべき
(実は)Z は A のみを経由して Y を引き起こす操作変数
操作変数の投入はバイアスを引き起こしうる
Z-bias
Song (Waseda WIAS) Confounder Selection 2019/04/23 10 / 21
Z-bias
N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig4.R)
U
3

6

εA

Z
2 // A
5 // Y εY
oo
共変量なしモデル ( ˆY = α + β ·A)
β = 5.885 (p  0.001)
共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·Z)
γ1 = 6.977 (p  0.001)
Song (Waseda WIAS) Confounder Selection 2019/04/23 11 / 21
代理変数の利用
DCC を満たさなくても代理変数 (proxy) が有効な時も
U


// A // Y
C
観察されていない U の代理変数として C を利用
C は A も Y も引き起こさないため、DCC だと投入しない
しかし、代理変数を使うことでバイアスが小さくなる場合も
ただし、代理変数の使用がバイアスの減少を保証するのではない
代理変数の選択は慎重に行うこと。場合によっては M-bias の原因に
なり得る
A と Y 両方を引き起こす変数の代理変数を使うこと
Song (Waseda WIAS) Confounder Selection 2019/04/23 12 / 21
代理変数を使うのは恥でもないし、役に立つ
N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig5.R)
U
4

7
##2 // A
6 // Y εY
oo
εC
// C εA
__
代理変数なしモデル ( ˆY = α + β ·A)
β = 9.479 (p  0.001)
代理変数ありモデル ( ˆY = α + γ1 ·A+ γ2 ·C)
γ1 = 6.571 (p  0.001)
Song (Waseda WIAS) Confounder Selection 2019/04/23 13 / 21
方法 4: Modified Disjunctive Cause Criterion
1 処置変数と結果変数の ˙ど ˙ち ˙ら ˙かの原因となる変数
2 処置変数と結果変数の ˙両 ˙方の原因となる変数
3 ˙操 ˙作 ˙変 ˙数の統制は避ける
4 上記の条件を満たさなくても未観察の変数の ˙代 ˙理 ˙変 ˙数
代理変数の選択は慎重に
代理変数は、処置と結果両方を引き起こす変数の代理変数がベスト
Song (Waseda WIAS) Confounder Selection 2019/04/23 14 / 21
交絡要因のタイミング
1 Wave データ利用時
Case 1.
BMI
zz %%
Activity // Disease
Case 2.
BMI
%%
Activity
::
Disease
Modified DCC の則ると ...
Case 1 の場合、BMI は統制 ⃝
Case 2 の場合、BMI は統制 × (パスがブロックされる = overconditioning)
Confounder? Mediator?
Song (Waseda WIAS) Confounder Selection 2019/04/23 15 / 21
交絡要因のタイミング
パネルデータ利用時
BMI
zz
Activity // Disease
パネルデータで、BMI と Activity が毎回測定されている場合、前期の
BMI を統制することで、Activity の効果量が推定可能
Song (Waseda WIAS) Confounder Selection 2019/04/23 15 / 21
Statistical Confounder Selection
統計的共変量選択アプローチ
因果ダイアグラムの知識が制約されている時にも利用可能
共変量が多く、N が適切 (modest) な場合に有効
ただし、理論に基づいて共変量を検討することが不可能
因果推論よりも倹約的 (pasimonious) なモデルを構築に向いている
例)
変数増加法 (Forward selection) / 変数減少法 (Backward selection)
Change-in-estimate 法
High-dimensional Propensity Score
機械学習
正則化回帰分析 (Ridge, Lasso, Elastic net など) も?(本文にはない)
Song (Waseda WIAS) Confounder Selection 2019/04/23 16 / 21
Forward/Backward Selection
因果ダイアグラム内の全ての変数が測定済みの場合、Forward/Backward
Selection は正しく共変量を選択する
あまり現実的な仮定ではない
共変量選択に使われたデータは実証に使うべきではない
Data-driven な方法であるため、新しくデータを収集すべき
データを分割して、探索用・分析用に使うのは精度 (precision) の問題
サンプルサイズ・変数の数の問題
N が小さく、共変量が多いと、飽和モデルに近いモデルが含まれる
Song (Waseda WIAS) Confounder Selection 2019/04/23 17 / 21
Change-in-Estimate
共変量が追加されることで因果効果 (or p 値) が閾値以上変化したか否か
で判断
閾値は主に 10%
因果効果を特定するに必要な共変量を用意する必要あり
Forward/Backward Selection と同様
ハザード比やオッズ比には使えない
Song (Waseda WIAS) Confounder Selection 2019/04/23 18 / 21
High-dimensional Propensity Score
Apparent Relative Risk Ratio に基づく選択
共変量と応答変数間の相対リスク比と Apparent 相対リスク比を計算
Apparent 相対リスク比が高い順位で共変量を選択
上位 10%など
応答変数との連関 (association) が小さい共変量を効果的に除去可能
応答変数との関係が一つずつ評価されるため、因果ダイアグラム上の
共変量が全て揃っていても、理論的には最善の結果を保証されない
Song (Waseda WIAS) Confounder Selection 2019/04/23 19 / 21
Machine Learning
最尤法と交差検証法 (Cross validation) を用いた方法
学習のために、Large-N が必要
開発途上であるため、更に研究が必要
Song (Waseda WIAS) Confounder Selection 2019/04/23 20 / 21
Conclusion
手元にあるデータから最善の選択を導く方法
Modified Disjunctive Cause Criterion
1 処置変数と結果変数の ˙ど ˙ち ˙ら ˙かの原因となる変数
2 処置変数と結果変数の ˙両 ˙方の原因となる変数
3 ˙操 ˙作 ˙変 ˙数の統制は避ける
4 上記の条件を満たさなくても未観察の変数の ˙代 ˙理 ˙変 ˙数は ⃝
ただし、代理変数の選択は慎重に行うこと
因果効果を推論するために十分 (suffice) な共変量のセット (total set) が用
意されている場合、統計的共変量選択法も有効だが、探索に使った
データを分析に使うのは不適切
金が余りすぎて邪魔ならいいかも
Song (Waseda WIAS) Confounder Selection 2019/04/23 21 / 21

More Related Content

PDF
星野「調査観察データの統計科学」第3章
PDF
傾向スコア:その概念とRによる実装
PDF
階層モデルの分散パラメータの事前分布について
PPTX
分割時系列解析(ITS)の入門
PPT
ロジスティック回帰分析の入門 -予測モデル構築-
PDF
時系列解析の使い方 - TokyoWebMining #17
PDF
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
PPTX
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ
星野「調査観察データの統計科学」第3章
傾向スコア:その概念とRによる実装
階層モデルの分散パラメータの事前分布について
分割時系列解析(ITS)の入門
ロジスティック回帰分析の入門 -予測モデル構築-
時系列解析の使い方 - TokyoWebMining #17
臨床疫学研究における傾向スコア分析の使い⽅ 〜観察研究における治療効果研究〜
Rで因子分析 商用ソフトで実行できない因子分析のあれこれ

What's hot (20)

PDF
統計的因果推論 勉強用 isseing333
PDF
ノンパラベイズ入門の入門
PDF
統計的因果推論への招待 -因果構造探索を中心に-
PDF
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
PDF
質的変数の相関・因子分析
PDF
『バックドア基準の入門』@統数研研究集会
PPTX
項目反応理論による尺度運用
PPTX
ネットワークメタ分析入門
PDF
Stanコードの書き方 中級編
PDF
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
PPTX
ベイズ統計学の概論的紹介
PDF
負の二項分布について
PDF
階層ベイズとWAIC
PDF
混合モデルを使って反復測定分散分析をする
PPTX
GEE(一般化推定方程式)の理論
PDF
2 4.devianceと尤度比検定
PDF
関数データ解析の概要とその方法
PDF
因果探索: 基本から最近の発展までを概説
PDF
ファクター投資と機械学習
PDF
傾向スコアの概念とその実践
統計的因果推論 勉強用 isseing333
ノンパラベイズ入門の入門
統計的因果推論への招待 -因果構造探索を中心に-
Rubinの論文(の行間)を読んでみる-傾向スコアの理論-
質的変数の相関・因子分析
『バックドア基準の入門』@統数研研究集会
項目反応理論による尺度運用
ネットワークメタ分析入門
Stanコードの書き方 中級編
科学と機械学習のあいだ:変量の設計・変換・選択・交互作用・線形性
ベイズ統計学の概論的紹介
負の二項分布について
階層ベイズとWAIC
混合モデルを使って反復測定分散分析をする
GEE(一般化推定方程式)の理論
2 4.devianceと尤度比検定
関数データ解析の概要とその方法
因果探索: 基本から最近の発展までを概説
ファクター投資と機械学習
傾向スコアの概念とその実践
Ad

Similar to 観察データを用いた因果推論に共変量選択 (20)

PDF
星野「調査観察データの統計科学」第1&2章
PDF
統計的因果推論の理論と実践 ch9 交互作用項のある共分散分析
PDF
ベイズ入門
PPTX
操作変数法の書き方_田淵貴大
PDF
非ガウス性を利用した 因果構造探索
PDF
バリデーション研究の入門
PDF
効果測定入門 Rによる傾向スコア解析
PDF
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
PDF
構造方程式モデルによる因果探索と非ガウス性
PDF
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
PDF
Diag test.shiraishi.2
PDF
第3回スキル養成講座 講義スライド
PDF
明日から読めるメタ・アナリシス
PDF
Bayesian statistics chapter2
PDF
みどりぼん読書会 第4章
PDF
Analysis of clinical trials using sas 勉強用 isseing333
PDF
20170225_Sample size determination
PPTX
生物系研究者のための統計講座
PPTX
統計的検定と例数設計の基礎
PDF
一般化線形混合モデル入門の入門
星野「調査観察データの統計科学」第1&2章
統計的因果推論の理論と実践 ch9 交互作用項のある共分散分析
ベイズ入門
操作変数法の書き方_田淵貴大
非ガウス性を利用した 因果構造探索
バリデーション研究の入門
効果測定入門 Rによる傾向スコア解析
構造方程式モデルによる因果推論: 因果構造探索に関する最近の発展
構造方程式モデルによる因果探索と非ガウス性
【DBDA 勉強会 2013 夏】Chapter 12: Bayesian Approaches to Testing a Point (‘‘Null’’...
Diag test.shiraishi.2
第3回スキル養成講座 講義スライド
明日から読めるメタ・アナリシス
Bayesian statistics chapter2
みどりぼん読書会 第4章
Analysis of clinical trials using sas 勉強用 isseing333
20170225_Sample size determination
生物系研究者のための統計講座
統計的検定と例数設計の基礎
一般化線形混合モデル入門の入門
Ad

More from Jaehyun Song (10)

PDF
Review: Cyrus, Samii, Laura Paler, and Sarah Zukerman Daly. 2016. “Retrospect...
PDF
争点空間の歪みと有権者の選択: 伸縮近接性モデルによる争点投票理論の統合
PDF
回帰不連続デザイン(Regression Discontinuity Design, RDD)
PDF
差分の差分法(Difference-in-Difference)
PDF
Differences-in-Differences
PDF
Teaching How Electoral Systems Change Political Outcomes Using a Role-Playing...
PDF
コンジョイント分析の方法論的検討
PDF
誰が選挙公報を見るのか - 無党派性と政治的有効性感覚に着目した日韓比較 (修正版)
PDF
誰が選挙公報を見るのか―無党派性と政治的有効性感覚に着目した比較研究―
PDF
韓国の地域主義は乗り越えられるかー選挙公約の役割の実証分析ー
Review: Cyrus, Samii, Laura Paler, and Sarah Zukerman Daly. 2016. “Retrospect...
争点空間の歪みと有権者の選択: 伸縮近接性モデルによる争点投票理論の統合
回帰不連続デザイン(Regression Discontinuity Design, RDD)
差分の差分法(Difference-in-Difference)
Differences-in-Differences
Teaching How Electoral Systems Change Political Outcomes Using a Role-Playing...
コンジョイント分析の方法論的検討
誰が選挙公報を見るのか - 無党派性と政治的有効性感覚に着目した日韓比較 (修正版)
誰が選挙公報を見るのか―無党派性と政治的有効性感覚に着目した比較研究―
韓国の地域主義は乗り越えられるかー選挙公約の役割の実証分析ー

観察データを用いた因果推論に共変量選択

  • 1. Review: VanderWeele, Tyler J., 2019, Principles of Confounder Selection, European Journal of Epidemiology, 34(3): 211–219. 社会科学方法論研究会 4 月例会 Jaehyun Song 早稲田大学 高等研究所 2019 年 4 月 23 日
  • 2. 概要 観察データを用いた因果推論における共変量選択基準 既存の方法の限界 1 Pretreatment criterion 2 Common cause approach 3 Statistical confounder selection Modified disjunctive cause criterion のすゝめ Song (Waseda WIAS) Confounder Selection 2019/04/23 1 / 21
  • 3. Notation and Definitions A: 処置 (exposure) Y: 結果 (outcome) Ya: A = a を受けた場合の潜在的結果 C: Weak ignorability を満たすための、観察された共変量 Weak ignorability を前提 C を統制すれば A と Ya は独立 Ya ⊥ A|C 処置 A の因果効果は E[Y1 −Y0|c] = E[Y|A = 1,c]−E[Y|A = 0,c] Song (Waseda WIAS) Confounder Selection 2019/04/23 2 / 21
  • 4. 方法 1: Pretretment Criterion (PC) 処置前に測定された変数を投入 U2 L A Y U1 ?? GG U は観察されていない要因 この基準だと L は統制すべき しかし、A–U1–L–U2–Y のバックドアが開かれ、バイアスが発生 ⇒ M-bias A と Y の関係を見るには、共変量は不要 Song (Waseda WIAS) Confounder Selection 2019/04/23 3 / 21
  • 5. M-bias N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig2.R) U2 2 −2 εL // L A Y εY oo U1 1 ?? 2 GG εA OO 共変量なしモデル ( ˆY = α + β ·A) β = −0.035 (p = 0.248) 共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·L) γ1 = 0.479 (p 0.001) Song (Waseda WIAS) Confounder Selection 2019/04/23 4 / 21
  • 7. 方法 2: Common Cause Approach (CCA) 処置変数と結果変数、両方に影響を与える処置前変数を投入 U // ## C // A // Y A と Y 間の変数のみに限定されるため、PC より少ない情報で ⃝ A と Y 両方の原因となる変数が ˙全 ˙て特定できれば、処置効果の推定 が可能 U は観察済みであり、C は Y の直接の原因ではないため、統制すべ きではない しかし ... Song (Waseda WIAS) Confounder Selection 2019/04/23 6 / 21
  • 8. CCA の限界 N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig3.R) U 2 // 5 $$ C 3 // A 4 // Y εC OO εA OO εY OO 共変量なしモデル ( ˆY = α + β ·A) β = 4.809 (p 0.001) 共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·C) γ1 = 3.900 (p 0.001) ⇒ C は common cause ではないが、統制した方が良い Song (Waseda WIAS) Confounder Selection 2019/04/23 7 / 21
  • 9. 両基準の比較 Pretretment Criterion 基準を満たす共変量を統制することによってバイアスが発生 too liberal Common Cause Approach 基準を満たさない共変量を統制しないことによってバイアスが発生 too conservative Song (Waseda WIAS) Confounder Selection 2019/04/23 8 / 21
  • 10. 方法 3: Disjunctive Cause Criterion (DCC) 処置と結果、どちらか、あるいは両方を引き起こす変数を統制 Fig.2 の例 PC: L は A の処置前変数なので統制 ⃝ → バイアス ⃝ DCC: L は A を引き起こさないので統制 × → バイアス × Fig.3 の例 CCA: C は Y を引き起こさないため統制 × → バイアス ⃝ DCC: L は A を引き起こすので統制 ⃝ → バイアス × 因果ダイアグラム内の変数が全て揃っているとしても、既存の 2 つ の方法はバイアスが生じうる ⇔ 因果ダイアグラム内の変数が全て揃っている場合、DCC はバイアス を最小化する Song (Waseda WIAS) Confounder Selection 2019/04/23 9 / 21
  • 11. Z-bias DCC も万能ではない U Z // A // Y DCC によると、Z は統制すべき (実は)Z は A のみを経由して Y を引き起こす操作変数 操作変数の投入はバイアスを引き起こしうる Z-bias Song (Waseda WIAS) Confounder Selection 2019/04/23 10 / 21
  • 12. Z-bias N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig4.R) U 3 6 εA  Z 2 // A 5 // Y εY oo 共変量なしモデル ( ˆY = α + β ·A) β = 5.885 (p 0.001) 共変量ありモデル ( ˆY = α + γ1 ·A+ γ2 ·Z) γ1 = 6.977 (p 0.001) Song (Waseda WIAS) Confounder Selection 2019/04/23 11 / 21
  • 13. 代理変数の利用 DCC を満たさなくても代理変数 (proxy) が有効な時も U // A // Y C 観察されていない U の代理変数として C を利用 C は A も Y も引き起こさないため、DCC だと投入しない しかし、代理変数を使うことでバイアスが小さくなる場合も ただし、代理変数の使用がバイアスの減少を保証するのではない 代理変数の選択は慎重に行うこと。場合によっては M-bias の原因に なり得る A と Y 両方を引き起こす変数の代理変数を使うこと Song (Waseda WIAS) Confounder Selection 2019/04/23 12 / 21
  • 14. 代理変数を使うのは恥でもないし、役に立つ N = 1000; 全ての誤差項は Normal(0,1) と仮定 (Fig5.R) U 4 7 ##2 // A 6 // Y εY oo εC // C εA __ 代理変数なしモデル ( ˆY = α + β ·A) β = 9.479 (p 0.001) 代理変数ありモデル ( ˆY = α + γ1 ·A+ γ2 ·C) γ1 = 6.571 (p 0.001) Song (Waseda WIAS) Confounder Selection 2019/04/23 13 / 21
  • 15. 方法 4: Modified Disjunctive Cause Criterion 1 処置変数と結果変数の ˙ど ˙ち ˙ら ˙かの原因となる変数 2 処置変数と結果変数の ˙両 ˙方の原因となる変数 3 ˙操 ˙作 ˙変 ˙数の統制は避ける 4 上記の条件を満たさなくても未観察の変数の ˙代 ˙理 ˙変 ˙数 代理変数の選択は慎重に 代理変数は、処置と結果両方を引き起こす変数の代理変数がベスト Song (Waseda WIAS) Confounder Selection 2019/04/23 14 / 21
  • 16. 交絡要因のタイミング 1 Wave データ利用時 Case 1. BMI zz %% Activity // Disease Case 2. BMI %% Activity :: Disease Modified DCC の則ると ... Case 1 の場合、BMI は統制 ⃝ Case 2 の場合、BMI は統制 × (パスがブロックされる = overconditioning) Confounder? Mediator? Song (Waseda WIAS) Confounder Selection 2019/04/23 15 / 21
  • 17. 交絡要因のタイミング パネルデータ利用時 BMI zz Activity // Disease パネルデータで、BMI と Activity が毎回測定されている場合、前期の BMI を統制することで、Activity の効果量が推定可能 Song (Waseda WIAS) Confounder Selection 2019/04/23 15 / 21
  • 18. Statistical Confounder Selection 統計的共変量選択アプローチ 因果ダイアグラムの知識が制約されている時にも利用可能 共変量が多く、N が適切 (modest) な場合に有効 ただし、理論に基づいて共変量を検討することが不可能 因果推論よりも倹約的 (pasimonious) なモデルを構築に向いている 例) 変数増加法 (Forward selection) / 変数減少法 (Backward selection) Change-in-estimate 法 High-dimensional Propensity Score 機械学習 正則化回帰分析 (Ridge, Lasso, Elastic net など) も?(本文にはない) Song (Waseda WIAS) Confounder Selection 2019/04/23 16 / 21
  • 19. Forward/Backward Selection 因果ダイアグラム内の全ての変数が測定済みの場合、Forward/Backward Selection は正しく共変量を選択する あまり現実的な仮定ではない 共変量選択に使われたデータは実証に使うべきではない Data-driven な方法であるため、新しくデータを収集すべき データを分割して、探索用・分析用に使うのは精度 (precision) の問題 サンプルサイズ・変数の数の問題 N が小さく、共変量が多いと、飽和モデルに近いモデルが含まれる Song (Waseda WIAS) Confounder Selection 2019/04/23 17 / 21
  • 20. Change-in-Estimate 共変量が追加されることで因果効果 (or p 値) が閾値以上変化したか否か で判断 閾値は主に 10% 因果効果を特定するに必要な共変量を用意する必要あり Forward/Backward Selection と同様 ハザード比やオッズ比には使えない Song (Waseda WIAS) Confounder Selection 2019/04/23 18 / 21
  • 21. High-dimensional Propensity Score Apparent Relative Risk Ratio に基づく選択 共変量と応答変数間の相対リスク比と Apparent 相対リスク比を計算 Apparent 相対リスク比が高い順位で共変量を選択 上位 10%など 応答変数との連関 (association) が小さい共変量を効果的に除去可能 応答変数との関係が一つずつ評価されるため、因果ダイアグラム上の 共変量が全て揃っていても、理論的には最善の結果を保証されない Song (Waseda WIAS) Confounder Selection 2019/04/23 19 / 21
  • 22. Machine Learning 最尤法と交差検証法 (Cross validation) を用いた方法 学習のために、Large-N が必要 開発途上であるため、更に研究が必要 Song (Waseda WIAS) Confounder Selection 2019/04/23 20 / 21
  • 23. Conclusion 手元にあるデータから最善の選択を導く方法 Modified Disjunctive Cause Criterion 1 処置変数と結果変数の ˙ど ˙ち ˙ら ˙かの原因となる変数 2 処置変数と結果変数の ˙両 ˙方の原因となる変数 3 ˙操 ˙作 ˙変 ˙数の統制は避ける 4 上記の条件を満たさなくても未観察の変数の ˙代 ˙理 ˙変 ˙数は ⃝ ただし、代理変数の選択は慎重に行うこと 因果効果を推論するために十分 (suffice) な共変量のセット (total set) が用 意されている場合、統計的共変量選択法も有効だが、探索に使った データを分析に使うのは不適切 金が余りすぎて邪魔ならいいかも Song (Waseda WIAS) Confounder Selection 2019/04/23 21 / 21