ラスカルの備忘録

ー 経済概観、読書記録等 ー

私家版「幸福の政治経済学」の試み(その1)

 ブルーノ・フライ、アイロス・スタッツァー「幸福の政治経済学」S・レヴィット、S・ダブナー「ヤバい経済学」には、社会生活に関係する指標を規定する要因を一般化線型モデル(GLM)*1を利用した回帰分析によって分析するという共通点がある。このような分析手法は、シンクタンクなどが実施した調査のマイクロ・データが比較的容易に使用できるようになった現在*2、様々な分野で応用が可能である。
 ということで、ここでは、とある経緯で偶々手元にある、某調査機関により数年前に実施された調査*3のマイクロ・データを用いて、幸福感を規定する要因を調べてみることとしたい。*4フライ等では、幸福を決定する要因を、①性格、②社会・人口統計上の特性(性、年齢等)、③経済(所得、失業、インフレ等)、④文脈・状況(労働条件、対人関係、健康等)、⑤制度、に区分しているが、当私家版においても、調査票を精査した上で、これらの要因(カテゴリーの区分については、若干変更する予定)と関係する調査項目を加工し、分析用のデータセットを作ることとする。
 なお、回帰分析に使用するモデルはプロビット・モデルとする。一般化線型モデルでは、被説明変数(応答変数)H=0,1 に対して、H=1となる確率P(H=1)が、説明変数(共変量)x=x(x1,x2,...,xn)を用いて、P(H=1)=F(Z)=F(a+b・x) という形で表現される。 プロビット・モデルの場合、Fは標準正規分布の累積密度関数であり、
F(Z)=\int_{-\infty}^Ze^{-\frac{t^2}{2}}dt
と表現される。被説明変数は、サンプルが「幸せである」場合をH=1、それ以外の選択肢の場合をH=0とする。説明変数は、幾つかのカテゴリーに区分された個人属性や主観的指標とする。回帰分析によって計測される各説明変数の係数biの大きさそのものには意味はないので、最後に、限界効果
\frac{\partial F}{\partial xi}=\frac{\partial F}{\partial Z}\frac{\partial Z}{\partial xi}=\frac{bi}{\sqrt{2\pi}}exp(\frac{-(a+bi)^2}{2}
を計算して、各要因の強さを評価することとしたい。(続く)

*1:岡田昌史編著「The R Book」第13章等を参照。

*2:SSJデータアーカイブ(東京大学)、社会調査データベース大阪大学)等を参照。なお、SSJデータアーカイブでは、プライバシー保護の観点から、利用者は研究者、大学院生に限定され、利用も営利目的ではなく学術目的の二次分析に限定されている。こうした点は、市場調査等にも広く利用できるプラットフォームの構築といった観点からみると課題が残る。また、調査にはシンクタンク等の実施したものの他に政府統計があり、こちらは、①回答の信頼性、②調査規模の大きさと回収率の高さ、③緻密な標本設計、④国勢調査等に基づく復元倍率の保有、といった点から前者よりも利用価値の高いものとなっているが、データ利用へのハードルは大きい。こうした有益な情報については、広く民間企業でも活用できるようにすれば、効率的な市場調査を行うことが可能となり、特段の申請なく誰でもネットからダウンロードできるようにすれば、行政効率が高まることにも繋がる。

*3:どの様な調査かについて詳しくは書かないが、標準的な標本調査理論によって偏りなく抽出された成人を対象としたものであり、サンプルサイズは1000以上。

*4:ていうか、暇があったらこれからやってみる。最低限、少ないNで言いたい放題の某下流本のような「痛い」分析にならないように致しまつw