ラスカルの備忘録

ー 経済概観、読書記録等 ー

末石直也『計量経済学 ミクロデータ分析へのいざない』

 2015年の刊行。取り上げるテーマは線型回帰に始まり、操作変数法、プログラム評価、GMM*1、制限従属変数、分位点回帰、ブートストラップ、ノンパラメトリック法と、わずか200頁の中で多くのテーマが取り上げられる。数式展開も概ね丁寧であり、それに増して、「痒いところに手が届く」記述が多い。日本語で読める計量経済学の書籍としては、現時点のベストと思われる。

本書の優位性

 最初の単回帰では、冒頭十数ページからロバスト標準誤差の話が出てくる。これまでの計量経済学では、誤差項が、分散が均一、互いに無相関、説明変数と無相関、期待値ゼロの正規分布に従うことを前提とし、不均一分散は例外的な扱いとされてきた。これは、均一分散の仮定の下、OLS推定量は線型不偏推定量の中で最良である(分散が最も小さい)ことを理論的根拠としてきたためと考えられるが、本書は「セミパラメトリック効率性」という別の根拠からOLS推定量を正当化し、不均一分散に対しロバストなWhiteの標準偏差を用いるのが現在の主流であるとする*2
 また、多重共線性については「多くの場合は放置しておくのが無難」とし、むしろ欠落変数バイアスの問題を重視する。多重共線性は、第4章でも行列表記により扱われ、〈完全な〉多重共線性のケースでは、係数の識別が不可能であることが、より分かりやすく説明される。

 操作変数法やプログラム評価が前半の章から取り扱われるなど、内生性による識別の問題*3が重視される近年の傾向を反映している。特に前者については、構造方程式の推定時における重要性からか高い比重が置かれ、第5章のGMMまで、基本的には、操作変数法による回帰モデルが扱われている。総じて、20年前の計量経済学と比較し「語り口」や「言葉」自体が変化している印象がある。
 ただし、因果推論に関係する記述は(相対的には)少なく、バックドア基準や傾向スコアに関する記述はない。また、時系列分析に関しても取り扱っていない。この辺りは、宮川雅己『統計的因果推論』、沖本竜義『経済・ファイナンスデータの計量時系列分析』などで補う必要があるだろう。

 第6章以降では、データの「打ち切り」やその場合の回帰(Tobitモデル、Heckmanの2段階推定法)、さらには分位点回帰、ブートストラップ、ノンパラメトリック法と続くが、これらを取り扱わない書籍が多い中、計量分析に関し取り扱う対象の幅広さは、本書の大きな優位性である。
 133頁以降には、トップコーディングされた米国CPS*4のデータ(March CPS)を使用した分位点回帰の結果が紹介されており、図らずも、米国マイクロデータの回帰分析においてデータの「打ち切り」を考慮することの重要性が理解できた。

(参考)

www.census.gov

*1:Generalized Method of Moments(一般化モーメント法)

*2:本書では取り扱わないが、他にも、クラスター性を持つデータ等から生じる系列相関に頑健な標準誤差が用いられることがある。(https://declaredesign.org/r/estimatr/articles/mathematical-notes.html

*3:本書では、「内生性」と「識別」というワーディングを一貫して使い、系列相関やセレクション・バイアス等に関係する問題が論じられる。

*4:Current Population Survey