備忘録

ー 経済概観、読書記録等 ー

小島寛之『宇沢弘文の数学』

宇沢弘文の数学

宇沢弘文の数学

2014年に亡くなった日本の大経済学者、宇沢弘文に対するオマージュ的書籍。「二部門経済モデル」など、宇沢の新古典派経済学者としての主要業績についても触れられているが、主として、「社会的共通資本」をめぐる思想的な側面が中心に語られ、特に、著者自身との出会いと経緯については、多くが語られている。本書の全体において「先生」という敬称が用いられ、著者がいかに宇沢に対し思いを抱いていたかが偲ばれる。後半を中心に、宇沢理論を継承する新たな潮流として、小野善康のマクロ経済モデル、松井彰彦の帰納ゲーム理論、ボウルズの選好の内生化に関する理論が取り上げられている。

新古典派から社会的共通資本へ

第2章「宇沢弘文は何を主張したのか」では、宇沢が新古典派経済学から社会的共通資本を中心とする宇沢理論へと舵を切った理由として、「新古典派の数学的な枠組み自体が、演繹できる帰結を限定的にしてしまい、それが現実の経済現象と相容れないこと」、「新古典派の枠組みの持つそのような限定的性質を極端な形で乱用」する傾向が新古典派経済学の中にみられ、反社会的(と宇沢自身が考える)帰結を量産していることを上げている(p.40)。前者に関して具体的にみると、「時間」をめぐる次元の問題と、「実数論」の基数的性質の問題が重視されている。

新古典派の理論は「可塑性」の概念を持ち、資本は時間をかけずにどんな財にでも変化できる。これは見方によれば、資本の量をその変化率、すなわちその時間微分という異なる次元に属するものと同一視している、ということである。また、アローとドブリューが完成させた一般均衡理論は、数学における不動点定理と「同値」であり、そのことを宇沢自身が証明している。この場合、「実閉体(実数の世界と思えばいい)のモデルでは、どんな問題も「決定論的」である」という実数論としての帰結の限定性に、一般均衡理論が縛られていることになる。

これらの指摘は、賛否はどうあれ、大いに興味を引くものではないかと思う。

社会的共通資本と数学

一方で、第3章「社会的共通資本としての数学」では、そこから更に踏み込んで、数学が持つ社会的共通資本としての性質と、数学を忌み嫌うがゆえに低い階層の属性を受け入れてしまう一群の人々がいることについて、ボウルズとギンダスの理論をもとに論じられる。

社会的共通資本について、著者は「自然環境や公共インフラ、医療制度や教育制度のように、人間の生活に欠かすことのできない基礎的装置であり、また、基本的人権に関与することから、市場取引に委ねることが許されない資本の総称」(p.45)と整理している。著者は、数学の社会的機能を本来性、言語性、歴史的伝承性、地域文化性、技術性という5つの言葉で整理し、それが社会的共通資本の持つ性質と共通している点から、数学は社会的共通資本であると位置付ける。

ところが現実には、数学は「選抜」の目的で受験競争に用いられるなど、人間が(日常言語と同様)先天的に備え持つという本来性に依拠するものとは異なる使われ方をしている、と著者は指摘する。特に、数学オリンピックについては、「「選民」的な発想を持つ」との厳しい言葉を投げかけ、財団の姿勢にも批判的である。このような著者の数学に対する視座は、本稿の筆者にとっては極めて強く違和感を持つところであるが、このことについて論じるのは内容紹介という本稿の趣旨を超えるため、稿を改めて触れることとしたい。

宇沢理論を継承する新たな潮流

宇沢理論を継承する新たな潮流として、小野善康のマクロ経済モデル、松井彰彦の帰納ゲーム理論、ボウルズの選好の内生化に関する理論が取り上げられていることは既に述べた。このうち、いわゆる「小野理論」については、本ブログの中でも過去に何度か取り上げた*1。ここでは、帰納ゲーム理論と選好の内生化について触れ、宇沢と著者が共有する思想の核心が何処にあるかについて、思うところを述べておく。

通常の非協力ゲームでは、確定したゲームの構造から演繹的に戦略が作られるが、帰納ゲーム理論では、プレイヤーが「空想上のゲーム」をプレイしながら行動し、知識を構築する。そうした過程から、差別や偏見が生まれることが、具体例をもとに論じられている。選好の内生化に関しては、インセンティブを付与することが新古典派経済学における帰結とは異なる帰結をもたらすことがある、というボウルズの議論が取り上げられている。

こうした議論をもとに推論を進めると、人間が持つ本来性とは関係なく、社会におけるゲームの仕方が差別や偏見を生み出し、あるいは帰納的に構築されたゲームのルールによって「選抜」的な状況が生じ、社会の中に「格差」が生じるという一種の社会観が生まれる。実際、帰納ゲーム理論を研究する松井彰彦による「障害」についてのつぎのような見方が紹介されている。

すなわち、「障害」というのは、絶対的に固有に存在している身体状態というのではなく、社会通念によってフィードバックされる「関係性の問題」である、ということだ。(p.88)

この議論をさらに敷衍すれば、能力、数学の出来・不出来といったものも、人間の本来性とは関係がない、社会が作り出したある種の見方に過ぎない、ということになるのかも知れない。数学的能力は、人間に「プレ・インストール」された能力であり、人間にとって本来的なものであるが、そこから「格差」を生み出しているのは、社会における関係性だ、ということなのだろう。こうしたところに、宇沢と著者が共通して持つ社会思想的側面があるように思われる。

しかし、こうした考え方において、例えば特殊な数学的才能者などの“the gifted and talented”は、どのように位置付けられてしまうのか、悪平等的に標準化された公共教育の中で、彼らは、むしろ差別される側になってしまうのではないか、さらには、彼らを理解でき、それを評価できる人間も、一定程度資質を持つ者に限られるのではないか、こうした人々こそが、国家または社会にとって、成長の機関的役割を果たすのではないか、といったような疑問が生じることは避けられない。これらの疑問は、正に、前節に述べた「違和感」と関係するものである。

真の失業率──2018年9月までのデータによる更新

完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

9月の結果をみると、完全失業率(季節調整値)は2.3%と前月から0.1ポイント低下、真の失業率も1.4%と前月から0.2ポイント低下した。引き続き、真の失業率は減少基調である。現推計時点において、真の失業率は基準年*1である1992年より改善していることとなる。

所定内給与と消費者物価の相関に関する8月までの結果は以下のようになる。物価および賃金はともに上昇基調である。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

*1:本推計において完全雇用が達成しているとみなす年。

多田洋介『行動経済学入門』

行動経済学入門 (日経文庫)

行動経済学入門 (日経文庫)

2003年に単行本として出版された本書は、行動経済学に関して出版された日本語の書籍としては最初期に当たる。その後も、行動経済学の基礎的理論は大きくは変わっていないとのことで、2014年に日経文庫として再録された後も当時のスタイルは維持されている。その後、ノーベル経済学賞の影響等もあり行動経済学に関する書籍の出版は相次いでいるが、本書の特徴としては、標準的な経済学についても丁寧に言及した上で、それと対比させる形で行動経済学の特徴をみていく点にある。

本書の構成

本書の構成を概観する。まず第1章では、標準的な経済学が想定する人間像「ホモ・エコノミカス」について、現実の人間は「超」が付くほど合理的ではなく、先送りの誘惑にかられ、常に利己的とは限らない、という点から限界があることを指摘し、その上で、ベイズ・ルール、期待効用仮説、時間を通じた消費決定モデルという標準的な経済学の基本的なツールを批判的に捉え直す。その際の事例としては、囚人のジレンマ、期待効用仮説に対するアレのパラドックス、多期間モデルに内在する強い仮定等が取り上げられる。

第2章では、限定合理性の経済学として、サイモンの最適化コスト、ゲーム理論の実証研究、アカロフの近似合理性や貨幣錯覚等が紹介されている。最適化コストを含めた経済主体の最適化問題Pを考える場合、修正された最適化問題F(P)を解くに際して再び計算コストが生じ、F^2(P)を解く必要が生じるため、「堂々巡りの問題」になるとするコンリスクの議論*1や、オークションでの合理的行動の結果、「勝者の呪い」とよばれる逆選択の状況が生じること等、限定合理性の経済学の中にある興味深い話が取り上げられている。

第3章から第7章までは、行動経済学の教科書的な話題が俯瞰的に取り上げられる。最初に、人間がつい「近道選び」をしてしまうことから統計的推測にもとづく合理的選択から外れてしまうケースとして、①代表性、②利用可能性、③係留効果、④自信過剰と保守性が、読者の心理に訴える具体的事例とともに説明される。*2

カーネマンらが名付けたプロスペクト理論は、人間の持つ心性である損失回避性を理論付ける。このことは、内容的には全く同じ設問に回答者が異なる回答をしてしまうフレーミングの問題*3にもつながっており、二つの設問によって「参照点」に違いが生じることで、人間のリスク認識を変化させ、相反する答えをさせてしまうことが論証的に説明されている。

第6章の双曲的割引モデルによる時間不整合性の説明も、上記2つの説明と同様、いまではメジャーな考え方になっているが、別掲に数式も記載することで、標準的な経済学が内包する指数的割引モデルとは何が異なり、時間経過とともにどのように違いが生じていくのか、という「勘所」が明確になっている。時間整合的な経済学が望ましいとされてきた理由として、「時間整合性は、現在の自分と将来の自分が、自分自身の効用最大化のやり方について互いに合意することを意味するという点で、望ましい経済主体の姿にふさわしい性質と考えられていること」が指摘されている。なおこの部分については、「自由意志」とはそもそも存在するのか、という根本的な議論にもつながるものと考えられ、興味を引くところである。

  • ダニエル・C・デネット「自由は進化する」

http://traindusoir.hatenablog.jp/entry/20080808/1218210745

経済学の規範性

最終章では、経済学が持つ規範性としての機能について、政策面への応用可能性という点を中心に述べられる。新古典派経済学は、パレート最適という規範性の機軸を持つ。一方、現実の人間の一見「非合理」な行動は、行動経済学の議論を踏まえれば「合理的な振る舞い」であるともいえる。この場合、その行動に対してパターナリズムの立場から指示を行うことは政策論として認められ得るか、という議論が生じる。本書は、そうした議論の一つである「穏健なパターナリズム」についても、最後に触れている。

この他にも、金融市場の分析における「行動ファイナンス理論」や、相互応報的動機がゲーム理論との関係において明示的に取り上げられるなど、新書でありながら、行動経済学に対する射程は幅広いものとなっている。

*1:https://www.jstor.org/stable/2729218?seq=1#page_scan_tab_contents

*2:最後の自信過剰の問題は、人間は「自分自身を悪いと考えることは不快であり、しばしば意図的に、判断を不利にするかもしれない事情から目をそらす」とするスミスの自己欺瞞の問題とも相通じるところがあるようにも思える。 http://traindusoir.hatenablog.jp/entry/20111123/1322048594

*3:タイラー・コーエンは、フレーミング効果をむしろ前向きに利用することで、人間生活に役立つものとすること推奨する。 http://traindusoir.hatenablog.jp/entry/20120111/1326283021

真の失業率──2018年8月までのデータによる更新

完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

8月の結果をみると、完全失業率(季節調整値)は2.4%と前月から0.1ポイント低下、真の失業率も1.6%と前月から0.1ポイント低下した。引き続き、真の失業率は減少基調である。現推計時点において、真の失業率は基準年*1である1992年より改善していることとなる。

所定内給与と消費者物価の相関に関する7月までの結果は以下のようになる。物価および賃金はともに上昇基調である。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

*1:本推計において完全雇用が達成しているとみなす年。

J・D・ヴァンス『ヒルビリー・エレジー アメリカの繁栄から取り残された白人たち』

ヒルビリー・エレジー アメリカの繁栄から取り残された白人たち

ヒルビリー・エレジー アメリカの繁栄から取り残された白人たち

田舎の白人労働者階級(ヒルビリー)に出自を持つ著者が上流階層の生活が営めるようになるまでの物語であり、そこには、現代米国の政治情勢を形作るに至る白人労働者階級の意識、上流階層の生活習慣の中に潜む社会関係資本ハビトゥスの効果等、興味深い逸話や指摘が含まれている。また、社会学等の実証研究についても言及し、自身の経験や主観的なものの見方が、客観性のある視点から補強される。

祖父母との生活が始まる9章以前の内容は、ヒルビリーの将来について悲観的な思いを抱かせる内容で、問題の根源が「家族」の中にある以上、これを改善する社会政策は、いまのところ見いだされていないようでもある。

異なるルール

本書の中で特に興味を引くところは、11章「白人労働者がオバマを嫌う理由」と13章「裕福な人達は何を持っているのか?」である。

オバマ前大統領に関しては、イスラム教徒であるとか、外国生まれである等のフェイクが一部で信じられているが、著者によれば、ヒルビリーたちがオバマを嫌う理由は他にあるとし、つぎのように指摘する。

私の高校時代の同級生には、アイビー・リーグの大学に進学した者がひとりもいないことを思い出してほしい。オバマアイビー・リーグのふたつの大学を、優秀な成績で卒業した。聡明で、裕福で、口調はまるで法学の先生のようだ(実際にオバマは大学で合衆国憲法を教えていた)。
私が大人になるまでに尊敬してきた人たちと、オバマのあいだには、共通点がまったくない。ニュートラルでなまりのない美しいアクセントは聞き慣れないもので、完璧すぎる学歴は、恐怖すら感じさせる。大都会のシカゴに住み、現代のアメリカにおける能力主義は、自分のためにあるという自信をもとに、立身出世をはたしてきた。もちろんオバマの人生にも、私たちと同じような逆境は存在し、それを自ら乗り越えてきたのだろう。しかしそれは、私たちが彼を知るはるか前の話だ。
オバマ大統領が現れたのは、私が育った地域の住民の多くが、アメリカの能力主義は自分たちのためにあるのではないと思い始めたころだった。自分たちの生活がうまくいっていないことには誰もが気づいていた。死因が伏せられた十代の若者の死亡記事が、連日、新聞に掲載され(要するに薬物の過剰摂取が原因だった)、自分の娘は、無一文の怠け者と時間を無駄に過ごしている。バラク・オバマは、ミドルタウンの住民の心の奥底にある不安を刺激した。オバマはよい父親だが、私たちは違う。オバマはスーツを着て仕事をするが、私たちが着るのはオーバーオールだ(それも、運よく仕事にありつけたとしての話だ)。オバマの妻は、子どもたちに与えてはいけない食べものについて、注意を呼びかける。彼女の主張はまちがっていない。正しいと知っているからなおのこと、私たちは彼女を嫌うのだ。

また、上流階層では、仕事を探すのにもヒルビリーの世界とは異なるルールが働く。地方の州立大学にいる時には、給料の高い仕事を求めて数十の求人に応募しても、すべて断られたが、イエールのロースクールでは、裁判所で熱弁を振るう男たちから、10万ドルを超える年収を手渡されようとしている。上流階層では、会社から面接に呼んでもらうために履歴書を書いて応募したりはせず(このやり方では、ほぼ確実に失敗に終わる)、代わりに友人の友人、親類の大学時代の知り合い、大学の就職相談窓口などのネットワークを使う。

もちろん、経歴のよしあしや面接の出来不出来が、就職とは関係ないと言っているわけではない。どちらも大切だ。だが、経済学者が「社会関係資本」と呼ぶものには、計り知れない価値がある。これは学術用語だが、それが意味することはシンプルだ。社会関係資本とは、「自分が周囲の人や組織とのあいだに持つネットワークには、実際に経済的な価値がある」ことを意味する。このネットワークは、私たちを会うべき人に引き合わせてくれたり、価値ある情報やチャンスを与えてくれたりする。ネットワークがなければ、自分ひとりですべてをこなさなければならない。

社会関係資本とは、友人が知り合いを紹介してくれることや、誰かが昔の上司に履歴書を手渡してくれることだけをさすのではない。むしろ、周囲の友人や、同僚や、メンター(指導者)などから、どれほど多くのことを学べる環境に自分がいるかを測る指標だといえる。私は、選択肢に優先順位をつける方法を知らず、ほかによい選択肢があるかどうかもわからなかった。自分のネットワーク、とくに思いやりのある教授を通じて、それを学んだのである。

社会政策による解決は可能か?

ラージ・チェティら経済学者チームによる実証研究によれば、貧しい家庭に生まれた子どもが実力社会で成功する可能性は、期待していたよりずっと低い。欧州の多くの国は、米国よりも「アメリカン・ドリーム」を実現しやすく、米国では、地域ごとに、成功の可能性には偏りがある。地域的な偏りがある理由は、母子・父子家庭の割合と、ほかの地域との収入格差である。

一方で、ヒルビリーの世界では、祖父母やおじ、おば、そのほかの親族などが子どもに対して果たす役割は、極めて大きいにもかかわらず、州の法律が「家族」をどのように定義しているかによって、そこから引き離され、里子に出されてしまうこともある。このように、「この国の福祉制度は、ヒルビリー向けにはつくられていない」ということである。(著者は、祖父母との生活をきっかけに、いまの生活へと至る道筋を得ている。)

地域格差については、政策では解決できない問題もある。

子供のころ、私は、学校でいい成績をとるのは「女々しい」ことだと思っていた。
男らしさとは、強さや勇気や闘いを恐れない心だ。もう少し成長してからは、女の子にモテることという項目が、そこに加わった。勉強していい成績をとるなんて、「お嬢様」か「オカマ」のやることだ。
どこからそんな考えが出てきたのかはわからない。学校の成績にいつも厳しかった祖母からではないし、祖父からでもない。だが、周りの子どもが全員そう思っていたことは確かだった。私と同じような労働者階層出身の子供の学力が下がり続けているのは、「勉強は女々しい」という思い込みが原因だという研究結果も出ている。

校内暴力花盛りし頃の地方の公立校出身の自分には、この最後のくだりには、極めて腑に落ちるものがあった。

真の失業率──2018年7月までのデータによる更新

※前回のエントリーでは、「中間改訂を7月結果公表時に行うことを検討する」と書きましたが、今回の推計では、中間改訂は行っていません。

完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

7月の結果をみると、完全失業率(季節調整値)は2.5%と前月から0.1ポイント上昇したが、真の失業率は1.7%と前月から0.2ポイント低下した。引き続き、真の失業率は減少基調である。現推計時点において、真の失業率は基準年*1である1992年より改善していることとなる。

所定内給与と消費者物価の相関に関する6月までの結果は以下のようになる。物価および賃金はともに上昇基調である。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

*1:本推計において完全雇用が達成しているとみなす年。

久保拓弥『データ解析のための統計モデリング入門 一般化線形モデル・階層ベイズモデル・MCMC』

データサイエンスと言わずとも、いまやビジネスの世界でも、回帰分析を用いデータの動きの背景にある各種属性の影響を分析したり、モデルにより予測を行ったりすることは、もはや「基本動作」となりつつある。とはいえ、こうした際に一般にみられるのは、筆者が本書を世に出すこととなった問題意識の一つでもある「ブラックボックスな統計解析」や、「何でも正規分布」「何でも直線」な統計モデリングである。これらは、ビジネスの世界どころかアカデミックな議論の場においても皆無と言い切れるものではない。前者に関し、筆者がみた「ブラックボックスな人たちの誤用あるいはおかしな作法」について、つぎのような記載がある。

  • 「ゆーい差」が出るまで検定手法をひたすらとりかえる
  • データの中の観測値どうしの割算によって新しい「指標」をでっちあげる…「ゆーい差」が出るまで新発明をくりかえす
  •  \mathbf{R}^2値は「説明力」なので、ひたすら1に近ければよい
  • 「等分散じゃない」とか文句をつけられたら、データを変数変換して回帰・ANOVAすればよい
  • あるいはめんどうになったら観測値どうしで割算値を作って、「ノンパラメトリック検定」をやればよい
  • 「検定を何度もやっているので多重比較だ」と文句をつけられれば、なんでもかんでも多重検定法による補正をやればよい
  • 論文中でデータを示すときには何でも検定してP値をつける。P値が小さいほど自分の主張は正しい

我々は、かなり注意していても、こうした「ブラックボックス統計学」、つまり一種の自己欺瞞に容易く陥る。さらには、こうして生み出された手法が、細分化された領域の中での「秘儀」として継承されたりもする。これらを避けるためには、アナリストは、データの性格やその振る舞いをよく確認し、解析の目的に沿った統計モデルを構築しなければならない。

「何でも正規分布」「何でも直線」な回帰分析ということに関しては、一部のケースを除き*1、(自分を含め、)自分の周囲でも通常みられる事実と言い得るように思う。本書では、統計モデリングにおいてまず考えるべきは、「この現象がどのような確率分布で説明されそうか」という点であると指摘し、その選び方としては、

  • 説明したい量は離散か連続か?
  • 説明したい量の範囲は?
  • 説明したい量の標本分散と標本平均の関係は?

といったことが注意点となるとしている。その上で、統計モデルを実際に推定するために必要となる手法・ツールが、一般化線形モデル(GLM)や、これを個体差が反映できるよう拡張した一般化線形混合モデル(GLMM)である。GLMを使用すれば、(応答変数の)確率分布、リンク関数、線形予測子を指定することで、様々な振る舞い方をするデータに対応した統計モデリングを行うことが可能になる。またその際、線形予測子の切片や係数等を決めるために用いられる推定方法が最尤推定法である*2

本書が取り上げる分析事例

本書では、まず、架空植物の種子数という離散的なデータ(カウントデータ)に関する統計モデリングを取り上げる。カウントデータの場合、例えば種子数が説明変数である体サイズごとに等分散な正規分布に従うとし、線形回帰モデル(GLMのオプション項目で確率分布をガウシアン、リンク関数を恒等関数に指定)で推定すると、①離散的な値に正規分布に従う連続的な値を当てはめている、②カウントデータであるのに予測がマイナスとなる場合がある、③図でみる限り等分散とはならない、といったおかしな結果となる。応答変数がカウントデータの場合は、ポワソン分布や二項分布を用いた統計モデルにする必要がある。本書では、種子数 \{ y_i \}がポワソン分布
 p(y_i|\lambda_i)=\frac{\lambda_i^{y_i}\cdot\mathrm{e}^{-\lambda_i}}{y_i !}
に従うとし、分布の平均(分散)*3は対数リンク関数を用いて
 \lambda_i=\mathrm{e}^{\beta_1 + \beta_2 x_i}
のように表されるとして、 \beta_1 , \beta_2の値を最尤推定する。本書では、推定の結果出てくるワルド統計量などの検定値の解釈の仕方、線形回帰の場合のP値との違いなども丁寧に説明している。また、観測値が非線形の場合、応答変数の対数変換値を用い通常の線形回帰を適用することは、一般的に行われる手法であるが、ポワソン分布、対数リンク関数、線形予測子を用いたGLMによる推定は、これとは異なるものである点が繰り返し指摘される。

さらに、ガンマ分布
 p(y_i|s,r)=\frac{r^s}{\Gamma(s)}y^{s-1}\mathrm{e}^{-ry_i}, ただし  \Gamma(s)=\int_0^\infty t^{s-1} \mathrm{e}^{-t} dt
を用い、花の重量を応答変数、葉重量を説明変数とする統計モデルの推定も行っている。ここでは、花の重量は連続値であるが、正の値しかとらないことから、そのバラツキは正規分布よりもガンマ分布で表現した方がよいとしている。ガンマ分布では、平均は \frac{s}{r}、分散は \frac{s}{r^2}となり、正規分布のように、平均と分散が独立になるわけではない。
本書の分析に使用されているデータは、著者のサイト*4よりダウンすることが可能であるので、同じデータを用いて散布図と回帰式及び残差の分散をみると、以下のようになる。




一方、同じデータについて、正規分布、恒等リンク関数を適用した線形回帰モデルを推定すると、つぎのようになる。


残差の分散は、説明変数が大きくなるほど広がっており、不均一な分散となっている。この問題は、最初に掲げた「ブラックボックスな人たちの誤用あるいはおかしな作法」にも関係するが、応答変数が正規分布に従うことが自然に認められるケースでは、ロバスト標準偏差で対応したりする。一方、本書が扱うのは、もっと一般に、応答変数が正規分布に従うことが疑われる場合にも適用できる統計モデルの拡張である。
ここまではGLMによる推定に限定した話を紹介したが、本書はさらに、個体差が無視できない場合(過分散)に用いるGLMM、さらには、マルコフ連鎖モンテカルロ法(MCMC)によるベイズ統計モデルや、その拡張である階層ベイズモデルへと話が進む。取りあえずのゴールである階層ベイズモデルについては、『データ中の説明変数と応答変数を対応づける「回帰」を目的とした統計モデルとしては、「今どきのデータ解析なら、少なくともここまでは考慮しよう」といった標準になりうる考え方』だとしている。

今では「緑本」ともよばれ、データサイエンスの世界を目指す人にとって「最低限のライン」と言われたりすることもある書籍であり、将来、この世界に進みたい若い人や、かつての計量経済学的なスキルが朽ちかけている中高年世代など、多くの人に読まれるべきと思われる。

*1:さすがに応答変数(被説明変数)が二値を取るケースで直線回帰を行うようなことは、行われていない。

*2:通常の線形回帰では、最尤推定法の結果は最小二乗法の結果と一致する。本書では、対数尤度の式中に残差平方和が表れる点を含め、このことが丁寧に説明されている。

*3:ポワソン分布では、平均と分散の値は一致する。

*4:http://hosho.ees.hokudai.ac.jp/~kubo/ce/IwanamiBook.html