備忘録

ー 経済概観、読書記録等 ー

野崎昭弘『「P≠NP」問題 現代数学の超難問』

 

「P≠NP」問題 現代数学の超難問 (ブルーバックス)

「P≠NP」問題 現代数学の超難問 (ブルーバックス)

 
  • チューリングは、人間が客観的な手順で行う情報処理は、チューリング機械により代行できると主張。また、ヒルベルトのいう決定問題には、一般的な解法が存在しないことがあり得ることを証明。例えば、不定方程式の解の存在を判定する一般的な方法は存在しない(第10問題)、②ある言語で書かれたプログラムに、あるデータを与えたとき、そのプログラムが有限時間内に停止するか否かを判定するプログラムは、その言語で書くことはできない(停止問題)。
  • ある特定のチューリング機械で、どんなチューリング機械の動作をも忠実に再現できるものがある(万能チューリング機械)。
  • 線形計画法は、古くからEXPに属することは知られていたが、1979年にカチアンが新しいアルゴリズムを発表し、Pに属することが判明。
  • 非決定性アルゴリズムでは、決定問題に対し、非決定論的(Non-deterministic)な選択を許す、つまり、幾つかの操作から一つを選ぶところで、どんな条件でどれを選ぶかを指定せず、ランダムに選ばせる、②計算量は、最も運がよい場合で数える、③答えがNOの場合は無視してよい。(一定回数の試行で終了)
  • NPクラスの問題は、非決定性アルゴリズムで、多項式時間(Polynomial time)で解ける。PがNPに含まれるのは確実。NPでかつPではない問題は、一つも見つかっていない。
  • ある問題QがNP完全であるとは、QはクラスNPに属している、②クラスNPに属しているどんな問題Xのどんな具体例αも、ある一般的な手順で問題Qのある具体例βに翻訳でき、その翻訳の手順はαのサイズの多項式時間で抑えられ、しかもαに対する答えがYESかNOかは、βに対する答えがYESかNOかに必ず一致する。
  • P=NPであるための必要十分条件は、あるNP完全な問題Qが、クラスPに属していることである。

河本薫『会社を変える分析の力』

会社を変える分析の力 (講談社現代新書)

会社を変える分析の力 (講談社現代新書)

 

著者は、大阪ガスで各種課題解決支援を手がける分析専門組織ビジネスアナリシスセンターの所長で、日経情報ストラテジー「データサイエンティスト・オブ・ザ・イヤー」の初代受賞者(2013年)。米国の研究所でデータ分析に従事した経験があり、2005年には大阪大学で博士号(工学)を取得、神戸大学経済学部の講師も務める。
本書で著者が一貫して主張するのは、ビジネスデータ分析を行う上で分析者が持つべきマインドであるが、分析者に限らず、むしろビジネスに携わる者すべてが参考とすべきものであるとの印象を受けた。「はじめに」で、著者はその経験をつぎのように述べる。

じつは私も、10年前まではデータ分析=数値計算ぐらいに思っていました。社内ではデータ分析のエキスパートのようにみなされ、「彼に頼めばどんなデータ分析もやってくれる」と重宝がられました。
しかし、あるときに「お前はまるでデータ分析の便利屋だな」と言われてから、自分の存在意義について疑問を持つようになりました。そんなとき、米国ローレンスバークレー研究所で仕事をする機会に恵まれました。黙々とデータ分析をこなす私に対して、米国人上司から「私はあなたに数値計算を期待しているのではない。分析を期待しているのだ」と諭されました。それを機会に、データ分析に関する考え方が大きく変わりました。それまで、データ分析の主役は高度な数値計算と思っていたのですが、それらは手段に過ぎない、単純な集計で十分ならばそれでいい。大切なのは、意思決定に役立つことなのです。それまで、周囲から便利屋扱いされていた理由もわかりました。私は、データ分析の仕事をしていたのではなく、データ分析に必要な行為(数値計算)を得意としているに過ぎなかったのです。

前述のマインドが生まれた背景には、こうした異文化との接触があったことがわかる。この後、一貫して主張するのは、いずれも「市場」というか、そうした場での他者との接触において生じ得るマインド・セットであり、(日本的な)組織の内部からは、(それ自体、単純なものであっても)なかなか見えてこないもののように思える。

分析の「価値」とは?

著者はまず、分析の「価値」をつぎのように整理する。

「分析の価値」=「意思決定への寄与度」×「意思決定の重要性」

意思決定とは、「経営、投資、営業、調達、オペレーションなどあらゆる局面における意思決定」を指す。高度な分析手法や大規模なデータを扱うことは、それ自体、価値を持つわけではない。投資額が巨大であるなど重要な意思決定において、分析結果が重要な材料とされることで、始めて価値を持つことになる。価値ある分析結果を作り出す上で分析者に必要なことは、①ビジネス課題を見つけ、②データ分析で分析課題を解き、③数値解をビジネスの意思決定において使わせることである。本書の第2章では、そのために必要な能力について具体的に論じられ、さらに第3章では、正しい心構えや習慣付けが論じられる。
ビジネス課題を解くことの正しい動機付けは、意思決定を支援することであり、一方で例えば「特定の意見を支持すること」は、間違った動機である。そうした場合、分析者は正に前述の「便利屋」に陥ることとなるだろう。

たとえば、投資判断のためのデータ分析において、あらかじめ投資することは決めており、それを正当化するために分析をする。たとえば、販売量予測において、増加傾向になるような結果のほうが上司にほめられるので、増加傾向になるような結果を出すよう分析する。これでは本末転倒です。悩ましい意思決定を決めるためにデータを分析するのに、すでに意思決定が決まった後で、データ分析をするのですから。

さらに、分析者が持つべき良い習慣づけとして、以下の九ヵ条をあげる。

  1. ビジネスの現場に出て、ビジネス担当者とコミュニケーションすることで、「チャンス」、「ヒント」、「ゴール」を見つけることができる
  2. 整理整頓を心がける
  3. ちょっとした質問を投げかけることで、分析者自身「分析ストーリー」が明確に描けているかがわかる
  4. データをビジュアル化する(結果の数値だけで判断しない)
  5. 他人のデータを疑う
  6. 単純なほどすばらしい
  7. 「ざっくり理解」ができるようになる*1
  8. 文章を書く(プレゼンテーション用の資料だけでは、「理解した気分」だけになる可能性)
  9. うまくいかなければ、分析の「目的」に立ち返る

分析モデルの限界

本書は、こうした分析者が持つべきマインドに関する内容が大宗を占めるが、分析結果をみる上で重要なポイントもいくつか述べられる。まず、どんな分析でも「分析モデル」を使うが、これは現実の問題を単純な問題に変換したものであり、数値計算結果の解釈を通じ、現実世界における解が導かれる。分析者は、分析モデルがどのような前提に立っているか、常に意識する必要がある。また、分析モデルから現実を再現することはできない。

分析モデルに関する最大の勘違いは、分析モデルを作り込めば現実をほぼ再現できるという思い込みです。エマニュエル・ダーマンは、著書”Models. Behaving. Badly.”の中で、分析モデルを模型飛行機のようなものと表現し、多くの分析者は、分析モデルという模型飛行機と実際の飛行機を区別できていないと述べています。分析モデルとは、プラモデルのようなものに過ぎないのです。

また、データ量が増えることだけでビジネスイノベーションを起こせるようになるわけでもない。ビッグデータもまた「いわば表面は実物と同じくらい精巧だが中身は空洞のプラモデル」に過ぎない。

ビクター・マイヤー=ショーンベルガーとケネス・クキエは、著書”Big Data : A Revolution That Will Transform How We Live, Work, and Think”の中で、ビッグデータの本質について、「部分計測から全数計測へ(from some to all)」という言葉で言い表しています。従来は、大量のデータを扱えなかったので、母集団の一部だけをサンプリングしてデータを計測していました(部分計測)。現在は、大量データを扱えるので、母集団のすべてをデータ計測できるのです(全数計測)。(中略)
たとえば、顧客に推薦する商品を決める場合、部分計測の世界では、アンケート調査などにより、「年齢が上がると、商品Aよりも商品Bを好む傾向にある」「所得が増えると、商品Cよりも商品Dを好む傾向にある」などの因果関係を検証し、それに従って顧客に推薦する商品を決めてきました。一方、全数計測の世界では、顧客間で購買行動の類似度を検証し(相関分析)、ある顧客に推薦する商品を決める場合には、その顧客と購買行動が類似している顧客が購買している商品とすれば良いのです。アマゾンは、この方法で顧客に商品を推薦し(リコメンデーション機能)、売り上げを伸ばしているのです。
(中略)但し、因果関係はわかりません。予測や判別の精度と分解能は高くなりますが、その根拠はわからないのです。

さらに言えば、ビジネス課題の解決にデータ分析を用いる場合、そもそもデータの存在を認識する必要がある。著者によれば、活用できる(社外)データは増え、その収集コストも低下しているとのことであるが、分析者にとっては、データの存在を認識し、アクセスできるようにすることもまた最初の一歩であり、このことが「躓きの石」となる可能性もあるだろう。

*1:フェルミ推定ができることは、これに該当するだろう。

真の失業率──2018年2月までのデータによる更新

完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

2月の結果をみると、完全失業率(季節調整値)は2.5%と前月から0.1ポイント上昇したが、真の失業率は2.6%と前月から0.2ポイント低下した。引き続き、真の失業率は減少基調である。

所定内給与と消費者物価の相関については、毎月勤労統計調査のサンプル替えに伴い、1月分確報の公表が遅れるため、今回は分析しない。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

真の失業率──2018年1月までのデータによる更新

 完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。今回は、推計の基礎となる潜在的労働力率を2017年まで延長推計た上で、2018年1月までの結果を過去に遡って再計算した。

 まず、年間の結果をみると、足許の2017年の真の失業率は3.2%で、前年よりも0.8ポイント低下した。また、公表値の完全失業率2.8%に対して0.4ポイントの開きがある。前回の推計値と比較すると、潜在的労働力率が変化したことにより、真の失業率は上振れしている(2016年の値で約0.4ポイント程度の上振れ)。改訂による年齢階級別潜在的労働力率の上昇幅は引き続き大きい。

 つぎに、1月の結果をみると、完全失業率(季節調整値)は2.4%と前月から0.3ポイント低下、真の失業率(改訂後)も2.8%と前月から0.1ポイント低下した。引き続き、真の失業率は減少基調である。(12月の真の失業率は、前回は2.1%としていたが、改訂により足許で0.7ポイント程度上振れし2.9%となった。)

 所定内給与と消費者物価の相関に関する12月までの結果は以下のようになる。物価および賃金はともに上昇基調である。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

アベノミクス以降の労働力率

 当ブログで継続して推計している「真の失業率」は、政権が交代した2012年末頃から低下し始め、足許では完全失業率(季節調整値)を下回っている。このことは、就業意欲喪失効果を可能な限り除去し雇用情勢の実態に即した指標であることを意図する「真の失業率」の解釈上、現下の雇用情勢は、推計上の基準年である1992年を超える好環境だということになる。しかしながら、物価や賃金の動きをみる限り、現時点の雇用情勢が1992年を超える好環境だとは解釈し難いものがある。また「真の失業率」は、このところ毎年の改訂で比較的大きく上方改訂され、改訂後でみると、完全失業率を上回る結果となる。
 「真の失業率」の推計過程では、年齢階級別の労働力率(15歳以上人口に対する労働力人口の比)から、潜在的労働力人口*1を推計する。潜在的労働力人口は年単位で推計しており、毎年1月に再推計するため、過去分の数値に改訂が生じる。ここ数年の改訂をみると、潜在的労働力人口は上方改訂される傾向にあり、「真の失業率」の分母(潜在的労働力人口)、分子(潜在的労働力人口-就業者数)は共に上方改訂されるが、相対的に分子の改訂率が大きくなるため、真の失業率は上方改訂される。見方を変えると、ここ数年、就業意欲喪失効果は縮小する傾向にあり、労働力率が上昇傾向にあることから、潜在的労働力人口の推計値は毎年上方改訂されている、ということになる。

 実際のデータ*2から、ここ数年、労働力率は高まり、このことが労働力人口の増加につながっているのか、あるいは労働力人口の増加分はどのように吸収されているのかをみることとする。労働力人口は完全失業者数と就業者数の合計であるから、完全失業者数はつぎのように表せる。
 U_t = \sum_a P_t^a \cdot r_t^a – E_t
ただし、 U_t, P_t^a, E_tはそれぞれ完全失業者数、15歳以上人口、就業者数、 r_t^a労働力率 t, aはそれぞれ時点、年齢階級を示すインデックスとする。さらに、完全失業率の前年差 \Delta U_tは、下式のとおり、人口寄与、労働力率寄与、交差項、就業者寄与の3つの寄与度に分割することができる。
 \Delta U_t = \sum_a \Delta P_t^a \cdot r_{t-1}^a + \sum_a \Delta r_t^a \cdot P_{t-1}^a + \sum_a \Delta P_t^a \cdot \Delta r_t^a + \Delta E_t
 実際にグラフでみると、つぎのようになる。

労働力率寄与は2013年以降、大幅なプラス寄与となり、数式上は完全失業者(労働力人口-就業者数)を増加させる方向に寄与している。近年の雇用情勢の改善において人口減少が寄与しているのではないか、との指摘を聞くことがある。人口寄与は確かに2013年から減少幅が拡大したが、同時に労働力率が高まったため、労働力人口全体としてみれば増加し、完全失業者を減少させる方向には寄与していない。特に足許の2017年は人口寄与の減少幅が小さく、労働力率が高まったことで、労働力人口全体としてみれば、むしろ完全失業者を大幅に増加させる方向へ働いている。いずれにせよ、アベノミクス以降、就業意欲喪失効果は大きく縮小し、雇用情勢の改善は本格化したことを示している。
 さらに労働力人口の増加分は就業者の増加によって相殺され、完全失業者は減少している。一方、2011年、2012年の完全失業者の減少は正に人口減少に伴うもので、この間、就業者の増加幅は小さいことがわかる。

 分析をしていて興味を引いたのは、労働力率寄与の増加分を年齢階級別にみた結果である。

増加寄与のうち60歳台以上の層が占める割合(寄与率)はかなり大きい。例えば、足許の2017年では、全体の増加寄与80万人のうち60歳台以上は44万人にもなる。60歳台未満の層も寄与度は増加しているが、高年齢層の労働力率増加がこれだけ大きな影響を与えていることの背景には、高齢者の継続雇用に関する制度的取り組みや、企業にも継続雇用を行うニーズがあること等が考えられる。

*1:潜在的労働力人口は、HPフィルターのグロース成分から推計した年齢階級別の均衡労働力率と、本推計上、完全雇用が成立していたと見なす1992年時点の「補正係数」をもとに推計。http://traindusoir.hatenablog.jp/entry/20090309/1236614999

*2:総務省労働力調査』。

真の失業率──2017年12月までのデータによる更新

 完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

 完全失業率(季節調整値)は2.8%と前月より0.1ポイント上昇したが、真の失業率は2.1%と前月より0.1ポイント低下した。引き続き、真の失業率は減少基調である。現推計時点において、真の失業率は基準年*1である1992年より改善していることとなる。
 なお、真の失業率の推計に用いる潜在的労働力人口(比率)は1年間の数値が確定した段階で新たに計算し直すこととしており、次回、今回の12月分を含む過去分の数値を遡って改訂することとする。

 所定内給与と消費者物価の相関に関する11月までの結果は以下のようになる。物価および賃金はともに上昇基調である。



https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

*1:本推計において完全雇用が達成しているとみなす年。

真の失業率──2017年11月までのデータによる更新

 完全失業率によって雇用情勢を判断する場合、不況時に就業意欲を喪失し労働市場から退出する者が発生することで完全失業率が低下し、雇用情勢の悪化を過小評価することがある。この効果(就業意欲喪失効果)を補正し、完全失業率とは異なる方法で推計した「真の失業率」を最新のデータを加えて更新した。

 完全失業率(季節調整値)は2.7%と前月より0.1ポイント低下、真の失業率も2.2%と前月より0.1ポイント低下した。引き続き、真の失業率は減少基調である。現推計時点において、真の失業率は基準年*1である1992年より改善していることとなる。

 所定内給与と消費者物価の相関に関する10月までの結果は以下のようになる。物価は8月以降、上昇幅が広がった。賃金は今春闘結果を反映し緩やかに増加しているが、10月の伸びはやや弱め。パート比率も10月は上昇し、賃金をやや押し下げた。

https://www.dropbox.com/s/fixt1abitfo58ee/nbu_ts.csv?dl=0

*1:本推計において完全雇用が達成しているとみなす年。