ラスカルの備忘録

ー 経済概観、読書記録等 ー

デイヴィッド・ハンド(松井信彦訳)『「偶然」の統計学』

 人は「偶然」を恰も「必然」であるかのように感じ、物語を紡ぎ出すことがある。またその「偶然」は、さほど珍しくないにも拘わらず、極めて稀なことのように思えてしまう。本書は、こうした「偶然」の特徴を統計学の知見をもとに、わかりやすく説明する。原題は“The Improbability Principle Why Coincidences, Miracles, and Rare Events Happen Every Day”であり、本文中では「ありえなさの原理」という言葉が使用される。

 最初に、数学者ボレルの発言に因む「ボレルの法則」—確率が十分に低い事象は決して起こらない—が取り上げられる。「十分に低い」というのは、人間的な尺度、地球的な尺度、宇宙的な尺度など、問題に応じ、その問題を考えるにおいて無視し得る、といった意味合いを持つ。個人的印象では、「ボレルの法則」とは、連続確率分布を考えたとき、確率密度関数 q(x)が仮に最大になる点 x=aであっても、その「一点」における確率はゼロになること、


P(a \le x \le a) = \int_a^a q(x)dx = 0 \hspace{10mm} q(a) \neq 0

を表現しているようにも感じられた(測度論とも相性はよい)。

 しかし一方で、世の中は驚くような出来事でありふれている。代表的なものとしては、本書のそこかしこで引用され(その都度disられ)るカール・ユングの『シンクロニシティ』である。この疑問には、筆者が「ありえなさの原理」と呼ぶ「到底起こりそうにない出来事はありふれている」という主張が答えてくれる。

ありえなさの原理

 筆者のいう「ありえなさの原理」とは、つぎの5つの法則である。

  • 不可避の法則

 起こり得るすべての結果を一覧にしたなら、そのうちのどれかが必ず起こる。サイコロを振れば、1〜6のどれかが必ず出る。

 十分に大きな数の機会があれば、どれほどとっぴな物事も起こっておかしくない(「ボレルの法則」も分母次第)。「組合せ」は機会の数を爆発的に増やす(プログラミングで全探索する際の○重ループでTime Limit Exceeded...など)。

  • 選択の法則

 事象が起こった後に選べば、確率はいくらでも高くできる。大災害のあと何かしらの兆候があったと暗に主張すること、ルーズベルトは日本軍の真珠湾攻撃を予期していたとする説など(後知恵バイアス)。

  • 確率テコの法則

 正規分布とコーシー分布は、見た目にはあまり違いがないが、nσのようなテール部分(極めて稀な事象)の確率には大きな違いがある。株式市場では、(正規分布を基にすれば)「10万年に一度しか起こらない」ような暴落が頻繁に起こる。

  • 近いは同じの法則

 十分に似ている事象は同じものとみなされる。カール・ユングにとって、患者が彼に甲虫の夢について話しているとき窓辺に甲虫が現れたことは偶然の一致であるが、筆者にとっては、大きな虫が窓を叩く音を耳にするのはありふれた現象である。しかも、その現象は結構うるさく、起こったなら確実に気づく。

 これらの「ありえなさの原理」は、人間が生まれつき持つ「思考の癖」による。これは、行動経済学においても取り上げられる人間の思考のバイアスである。よって、ありきたりの出来事を極めて起こりそうにない出来事のように感じてしまうことになる。

 一方で、極めて起こりそうにない出来事(「ボレルの法則」に従えば決して起こりえない出来事)を目にしたときは、状況の理解に誤りや見落としがあった可能性がある。データが得られたら、競合する説明それぞれについてそのデータが得られる確率を計算し、その確率が最大となる説明を選択することは「尤度の法則」などと呼ばれ、統計的手法の一つの基本原理である*1。十分に起こりそうにないと見えたときは、それを疑う根拠が存在することを持って他の説明を探す、というのが統計的推論の基本となる。

*1:この尤度原理については、現代思想2020年9月号『統計学/データサイエンス』掲載の小島寛之三中信宏対談で取り上げられており、非常に興味深いものとなっている。

小島氏が尤度原理の「わからなさ」を述べるのに対し、三中氏は、尤度原理は「決して正しい結論を導き出すための方法ではない」、「統計学というのはもともと真理の発見といったことを求めていないというか、そもそもあの学問体系では無理」と指摘する。