ラスカルの備忘録

ー 経済概観、読書記録等 ー

清水昌平『統計的因果探索』など

 実証分析における因果推論の「興隆」に関しては、これまでも様々な書籍を取り上げてきたが、その重要性は、もはや論を待たないものとなっている。また、2010年の「信頼性革命」以降、リサーチデザインを重視した誘導型による因果推論が高まってきたことも既に述べているが、本書が取り上げる線形非ガウス非巡回モデル(LiNGAM)*1は、これらとは異なり、あらかじめ因果のモデル(有向非巡回グラフ)を仮定して分析を行うのではなく、データそのものから因果の方向と大きさを測定するアプローチをとる(ただし、一定の数理的仮定は必要)。

因果探索の手法

 本書は2017年の出版。その時点の記載内容からは、未観測共通原因(交絡因子)の存在を仮定する因果探索など、まだ発展途上の印象を受けるところもある。また、現実に存在する観察データをもとに因果のモデルを推定することは、かなり難しい作業であることが予想される。

 一世を風靡したグレンジャー因果は、未観測共通原因が存在すれば、因果の定義として破綻することが知られています。現在、未観測共通原因が存在しても破綻しないような因果の定義やそれを定式化するための数学的道具の整備が進み、未観測共通原因による疑似相関を見破るデータ解析法を研究開発するための数理的基盤が整いつつあります。
 本書で解説したLiNGAM法は、線形性・非巡回性・非ガウス性の仮定が成り立てば、未観測共通原因があっても、因果関係を推測可能です。今後、未観測共通原因がない場合にすでに行なわれている非線形性や巡回性のある場合と同様の拡張は可能でしょう。また、関数系の仮定をどこまで緩められるかや離散変数が混在している場合はどうなるのかといったことは依然として未知であり、多くの興味深い研究課題があります。[pp.165-166]

 因果探索に関しては、2020年刊の小川雄太郎『つくりながら学ぶ! Pythonによる因果分析』*2も読んでいるが、こちらは分析実践の取っ掛かりを与えることに主眼を置く。因果のモデルに係るバックドア基準からランダム化比較試験という流れに加え、後半では、さまざまな因果探索の手法がコード付きで紹介されている。

具体的には、LiNGAMのほか、ベイジアン・ネットワーク、ディープラーニングを用いた因果探索であるSAM*3などが、Pythonのコード付きで紹介されている。なお、サンプルデータは、構造方程式モデルを仮定し、当該モデルのシミュレーションで発生させたものを用いているが、実際の観察データを用いた場合、どのように因果モデルが推定され、どの程度、納得感のあるモデルが推定できるのか、というところで隔靴掻痒感は残る。

*1:LiNGAMは、ノンパラメトリックパラメトリックセミパラメトリックという因果探索の3つのアプローチのうちのセミパラメトリック・アプローチに相当。

*2:同書では、扱う範疇は相当幅広いものの、理論の細部は他書に委ねる。バックドア基準の説明はわかりやすい一方、傾向スコアの説明に誤謬があるため、あらかじめ正誤表を確認することを薦める。

*3:Structural Agnostic Modeling