河川の延長一覧でも、都市の人口一覧でも、原価一覧でもいい、手元に数字の一覧があれば、その中でどのくらいが1から始まっているか確認してほしい。おおくの場合、1が最初の桁となっている数字が3割前後を占める。発見者の名をとってベンフォードの法則と呼ばれる現象だ。
手元で確認したなかから例を出すと、日本の百名山のうち35の標高が1からはじまっているし、東京都内の主要地方道の4割が1から始まっている。1990年以降における大学入試センターの数学問題を調べたところ、正答の4割が1から始まっていたという調査もある。答えにつまったとき、単に鉛筆を転がすより、まず最初の桁に1を記入する方がよいことになる。
入試センターの裏技としては、ルートの中に数字をひとつ入れる場合は3が正解である確率が高い、4択や5択の問題では両端が正解になる確率は低いなども知られている。不思議なことではあるけれど、世の中とはそういうもののようで、起こりやすいことは起こりやすく、起こりにくいことは起こりにくい。
言語ではジップの法則というのが知られている。英語の場合、もっともよく使われる単語の出現頻度を1とすると、2番目はその2分の1、3番目は3分の1と、グラフにすればちょうど右下がりの直線になる。傾きは多少変わってくるけれど、同様のグラフはほかでも見られる。地震の大きさと発生頻度、論文の数と引用回数、都市の数と人口規模、戦争の数と死亡者数。新しいところではウェブページのアクセス数でも話題になった。
右下がりのグラフといえば、1/fの風として扇風機で話題になった「ゆらぎ」もそうだ。心拍間隔やホタルの光など自然に見られる「ゆらぎ」。神秘主義に陥る必要はないし、個人の自由意思が縛られるわけではない。ただ、疲れたときは、こんな現象を思い出して、世の中にはそんな大きな流れもあるんだって、肩の力を抜いている。
ベンフォードの法則については「Benford” s Law」「Following Benford” s Law or Looking Out for No. 1」をご参考に。日本百名山の標高については「山どんの資料室」を、東京都内の地方道については「県道一覧集」を参考にしました。また大学入試センター試験については「センター試験間近 知って得する!?“裏技”」「正解の4割は「1×」 センター試験、数学の答えに偏り」をご参考にどうぞ。ジップの法則については、「Zipf” s Law」「Benford” s Law and Zipf” s Law」「複雑系とまちづくり(5)」「永井俊哉講義録 第40号」「新しい地域発展論”ベキ法則下での地域の生き方」を、さらにウェブページの人気度については「Diversity is Power for Specialized Sites」を参考にしました。その他歴史に見られるべき法則についての参考書としては、『歴史の方程式』があります。さらに1/fゆらぎについては「ゆらぎ研究所」「F分の1ゆらぎの謎にせまる」「ホタルの光の不思議」「日本ゆらぎ現象研究会」でどうぞ。
番号の多くは1から順につけるのだから、1が多くてあたりまえのような気がしますが?
例えば、山の標高は最高で富士山の3676m。1から始まる確立は、標高が103桁の場合は確立的に1/10ですが、4桁の山では1/3増えますよね。計算的にも1が多くなります。(もっとも、この場合は2、3も多くなりますが。)
(私の理解不足でしたらごめんなさい。)
ちなみに、メールにおいて、サイトへのリンクが間違っていました。
うり助さん、ありがとうございます。
百名山の場合は、確か1500メートル以上の山が基本で、最高で3000メートル台なのでおっしゃるとおりなのですが、道路延長の場合だと別に1メートルの道路から順に作るわけではないので、1が頭にくる必然性はないように思います。
仮に100未満の数字でランダムに数字をピックアップした場合、1が頭にくるのは、1、10、11、……19の11個だから、確率としては1割そこそこのはずなのに……というのがベンフォードの法則のおもしろいところとお考えください。
感想ページへのリンクの間違いの件、ごめんなさい。
参考書へのリンクとダブっちゃってました。お恥ずかしい……。
初めまして、いつも楽しみにさせて頂いています。
ベンフォードの法則、というのですね。
初めて知りました。
私は、これは対数の問題だと思います。
いろんなオーダーの物をランダムに生成した場合(対数軸上にランダムに点を打った場合)、先頭の数字が102の範囲に入る確率はlog2-log1=0.301…というところに起源を持つのだと思います。