1と0をランダムに10個並べてほしい。あなたはどう書くだろう。「1010100110」といった並びが多いだろうか。手もとの表計算ソフトで実際に発生させてみる。1111011110。もう一度。0011000000。同じ項の続きをランというけれど、ランがあんがい長いことに驚かれたのではないだろうか。ランダムにといわれると、ぼくたちは長いランを避けようと、つい人為的なものを作ってしまうのだ。
日常的な考え方が自分を縛ることが、しばしばある。開幕したばかりのプロ野球、打率5割や6割というバッターがいる。この人は春先は調子いいけれど夏になると調子を落とすと考える人はさすがにいないと思う。春先は打席数が少ないから、統計的に大きなぶれがあるのは仕方なく、打席を重ねるごとに3割なりといった平均的な打率に落ち着く。しかし、新人王をとった次の年は成績が落ちるという、いわゆる「2年目のジンクス」の原因を尋ねられるとどうか。オフの間にトレーニングできなかったからとか、プレッシャーや慢心といった答えをしがちじゃないだろうか。実際は、多くの選手の中でとびきり成績が良かったから新人王に選ばれたわけで、そんな成績が2年も続くほうが珍しい。
トゥベルスキーとカーネマンが事前確率を無視する傾向として提出している問題も示唆的だ。1000人に1人の割合で感染する病気があるとする。検査薬を使えば、感染していれば0.98の確率で陽性反応が出るが、感染していなくても陽性反応が出る確率も0.01ある。今ひとりの人に陽性反応が出たとして、その人が感染している可能性はどれだけか。多くの人は、0.98と考えて絶望的な気持ちになる。でも実際には、感染する確率がそもそも0.001なのだから、総合的に考えると感染の可能性は0.089、非感染が0.911と、まだまだ非感染の可能性が高い。
手軽に済ませようとすると、真実をつかまえそこねる。そうとわかっていても、今日の松井の打率はと開幕数試合で気にしてしまう自分がいて、それが悲しくもおかしい。
コラムで紹介したのは、認知心理学では比較的有名な事例です。市川伸一さんの『考えることの科学』に詳しいです。なお文中、感染率の計算は、ベイズの定理というものを使います。陽性反応が出たうちの感染者の確率を求めるわけですが、まず感染者数は0.001×0.98で求められます。これを分子にして、分母は、陽性反応が出る確率なので、「0.001×0.98+0.999×0.01」となります。
バナナです。
感染率の計算にはビックリ。
感染していなくても陽性反応が出る確率が少しでも
ある&事前確率(そもそもこの病気はとっても珍し
い)というのが組み合わさってこうなるんですね。
いろんなことを考えさせられる話です。
なるほど、ベイズの定理というのはそういうふうに使われるものだったのですね。
以前ネットの記事でベイズの定理に関するものを読んだのですが、有益な理論であることは何となくわかるのですが、どのように使われているのかが正直よくわかりませんでした。
が、今日のコラムのおかげで、実感としてわかりました。
ありがとうございました。
なんだかすんなり納得できない。検査薬を使えば、感染していれば0.98の確率で陽性反応が出るというときの0.98の確率の意味がよくわからない。すでに、陽性反応がでたとすれば、1000人に1人の割合でかかる病気というのはもう条件として考える必要がないような気がする。本買って読んでみようかな。その前にもう少し考えてみようか。陽性反応がでているのに確率が0.089なんて・・・
藤島さん、ありがとうございます。そうだ、この記事もベイズ理論についてでしたね。それを思い出していれば、違ったコラムになったかも。
悩んでます。さん、感染率とあわせて、よく取り上げられるタクシー問題というのがあるのですが、それをちょっと作り変えて下記します。
ある市に青いタクシー会社と緑のタクシー会社がある。青いタクシーは1台、緑のタクシーは999台で営業している。夕暮れ時、ある人が「あ、青いタクシーだ」と通り過ぎる車を見て言った。
さて、その人の言葉を信じるでしょうか?
日照条件などから間違える可能性はあります。別の機会にテストすると、98%は正しく色を見分けたけれど、緑なのに青と見間違える可能性が1%ありました。
こうすれば条件は感染問題と同じですが、おそらく98%その人が正しいとは思わないのではないでしょうか。「どうせ見間違いだよ」って言いそうな気がしません? 少しは事前確率を無視する傾向が薄れた?
まあ、いずれにせよ、少なくとも、検査薬を使う前の感染確率0.001から0.089へ、いわば89倍も感染確率があがったとも言えるわけで、そう考えれば納得かもしれませんね。
こんなことも言えます。
サイコロを10回振って全て1であったとすると
ほとんどの人は奇跡が起きたように感じると思います。
とことが5、3、2、6、2、1、1、4、5、3
と出た場合は気にもとめないで普通のことが起きたと
感じることと思いますが、確率的にはどちらも
(1/6)の10乗で全く同じ確率です。
ベイズの定理と同内容ですが、次のように考えるとすっきりします。
今、100000人の集団(S)を考えます。
感染するのは1000人に1人の割合なので、集団(S)の中で感染しているのは100人です。
すると当然、感染していないのは99900人です。
感染している100人の中で、陽性反応があるのは98人。
感染していない99900人の中で、陽性反応があるのは999人。
だから、集団(S)の中で、陽性反応があるのは、98+999=1097人。
その中で感染しているのはたったの98人なので、
陽性反応が出た人が感染している確率は、98÷1087=0.089… となります。
ベイズの定理は、なんか大げさすぎて嫌いです。
このように考えればあたりまえの内容でしかないですし。
小室さん、まさにその通りですね。「定理」なんて言って数式を用いるから難しげに聞こえる面はありそうです。ポイントは、こうした順序だてた計算と、直感的な「感じ」が一致しないということ。人間っておもしろいです。
マイケルさん、ほんと、それも直感と理論のずれのいい例ですね。1が10回続けて出た後、次に1が出る確率はと問われると、つい出ない確率がずいぶん高くなったように思いがちです。でも実際は、それまでと同じですものね。