ラスカルの備忘録

ー 経済概観、読書記録等 ー

伊藤公一朗『データ分析の力 因果関係に迫る思考法』

データ分析の力 因果関係に迫る思考法 (光文社新書)

データ分析の力 因果関係に迫る思考法 (光文社新書)

因果性と相関性を区別することの重要性は、近年、様々な書籍等で指摘されているが、本書もその一つ。著者はシカゴ大学助教授で、専門は計量経済学、特に環境政策・エネルギー政策の実証分析を行っているが、大学院生向けにデータ分析の理論と応用の講義も行う。

エビデンスの「質」が高い、すなわち因果性をより正確に捉えることができるデータ分析の手法として、ランダム化比較実験(RCT)が注目されているが(バナジー、デュフロ『貧乏人の経済学』、内閣府『経済財政白書におけるEBPMの手法』等)、本書の中心を占めるのも、RCTの手法と考え方、実際の分析事例などである*1。この他、RDデザイン(自然実験)、集積分析、パネル・データ分析についても取り上げるが、操作変数法、マッチング推定法等、数学的に高度な知識が要求される分析手法の説明は割愛されている。また、結果の有意性を判断するためには、統計的推定に関する一定の理解が必要であるが、この点に関する記述も割愛され、視覚的な結果の表現に留められている。

ビジネスや政策上の「介入」が意図した成果をもたらしているのか、データ分析をもとに判断する際、サンプルが持つ「介入」以外の他の属性の影響を除去することは、今や基本的な作法というに等しい*2。このため一般に行われるのが回帰分析である。ただし、回帰分析でできるのは、データから把握できる属性の影響を除去することであり、データから把握できない未知の属性の影響は、除去することができない。また、一般的に指摘されていることであるが、回帰分析からわかるのは、あくまでデータ間の相関性であり、因果性を捉えることはできない。

本書は、因果性を立証することが困難な理由として、①(「介入」以外の)他の属性の要因が影響していた可能性、②逆の因果関係だった可能性、の2つを指摘するが、この指摘は類書とも共通する。これらの問題を可能な限り除去し、「介入」の効果を判断可能にしてくれる分析手法として真っ先に紹介されるのがRCTである。

RCTでは、サンプルを「介入グループ」と「比較グループ」にランダムに振り分け、グループ間の平均値の差を取り、これを平均介入効果として測定する。この分析が意味を持つ上で前提となるのは、介入がなかった場合は介入グループと比較グループの平均値は等しくなるという仮定である。もし対象の振り分けがランダムではなく、例えば希望に応じて介入を与える場合、「自己選抜バイアス」が生じ、この仮定は成立しない。一方、ランダムに振り分けを行えば、(多数のサンプルを確保することで)大数の法則が働き、「自己選抜バイアス」に相当する部分のグループ間の平均値の差はゼロに収束する。

本書で紹介されるRCTの事例は米国のものが多いが、オバマ前大統領の選挙運営がウェブサイトの画面を決定する際、RCTを先行実施し、効果が大きかった組合せに決定したことなど興味を引くものが多い。RCTの実施には費用や労力、関係機関の協力など高いハードルがある。一方、本書の最後に紹介されるパネル・データ分析は、一部の分野ではデータの蓄積も進んでおり、RCTと比較すればハードルは小さい。ただしこの場合、介入がなかった場合は介入グループと比較グループの平均値は平行に推移する(平行トレンドの仮定)というより強い仮定が置かれる*3。また、本書では紹介されない操作変数法等の手法は、実施することのハードルは、さらに小さくなるものの、エビデンスの「質」は低下する。類書にない本書の優位性を一つあげるとすれば、米国の豊富なRCT実施事例を取り上げ、日本において同様の立場にある人に対して示唆を与えることで、実施の可能性を高めてくれることにあるだろう。

最後に上級編として、①データ自体に問題がある場合はすぐれた分析手法でも解決は難しい*4、②分析結果の「外的妥当性」という問題、③「出版バイアス」と「パートナーシップ・バイアス」という問題、④介入に「波及効果」がある場合の問題点、というデータ分析に関わる4つの問題が論じられる。RCTは、「介入」が持つサンプルに対する因果性という意味での「内的妥当性」については、非常に強く確保されていると言えるが、一方で、分析で使われたサンプル以外にも適用できるのか、という「外的妥当性」については、必ずしも十分に確保されるものではない。また、「パートナーシップ・バイアス」は、河本『会社を変える分析の力』を取り上げた際に触れた「間違った動機」に共通する問題である。

traindusoir.hatenablog.jp

ビジネス課題を解くことの正しい動機付けは、意思決定を支援することであり、一方で例えば「特定の意見を支持すること」は、間違った動機である。そうした場合、分析者は正に前述の「便利屋」に陥ることとなるだろう。

*1:巻末には、数学的な補足として、①RCTでは観測対象を「介入グループ」と「比較グループ」にランダムに振り分けることで、自己選抜バイアスをゼロに収束させること、②ランダム化は観測できない(実際には起こらなかった)属性にも同じ効果をもたらすこと、③ランダム化は平均値のみならず分布特性値にも同じ効果をもたらすこと、の証明が掲載されている。

*2:これ以外に、属性間の平均値の差が小さい場合、統計的推定の知識に則り、その差の有意性を確認すること(カイ二乗検定)等も、今や基本的な作法と言うに近いものがある。

*3:ここに紹介されているパネル・データ分析は、一般に固定効果モデルとよばれるもので、時点間の差をとることで固定効果(未知の属性を含む「介入」以外の他の属性による効果)を除去し、回帰分析を行う。この場合、固定効果は時間とともに変化しないことが前提となる。

*4:「ゴミデータ」問題。「ゴミ」を渡されて「何とかしろ」と言われても何ともならない、という問題か。