じぶん更新日記

1997年5月6日開設
Copyright(C)長谷川芳典



03月のインデックスへ戻る
最新版へ戻る

 3月25日は卒業式が行われた。毎年、この日には季節の花を飾ることにしている。花桃、ミモザ、ジャノメエリカの3種が定番となっている。


2015年03月26日(木)



【思ったこと】

1から始まる数をよく見かけるのはなぜか?(1)ベンフォードの法則

 日常生活では、年月日、気温、時刻、車のナンバー、口座番号、チケット番号、....というように、さまざまな数値を見かけるが、それらを手当たり次第にメモしていくと、なぜか「1」から始まる数値が多いように思われる。

 例えば、
  • 西暦年では、日本史や世界史に出てくる重要な出来事は圧倒的多数が「1***年」というように「1」で始まっている。
  • 24時間表示の時刻では「0時から23時までの24通りの時刻表示のうち、1時と11時〜19時の10通り、つまり10/24=5/12が1から始まる時刻となっている。
  • 日本の気温はおおむねマイナス20℃から45℃であるが、このうちマイナス10℃〜19℃と、1℃、10℃〜19℃は「1」で始まる温度。20℃台や30℃台の気温もかなり多いが、50℃以上はありえないので、相対的に「1」から始まる温度が多くなる。
 このように「1」から始まる数値が多いのは、位取り記数法に起因しているようだ。有限の量は必ず何桁かの数値で表される。話を分かりやすくするため、とりあえず整数部分のみに注目し、正数であった場合を考えてみよう。ここで仮に最大値が3桁(n**)で表されたとする。この場合、最小値0から最大値までの数値が矩形分布で出現したとすると、
  • 1桁の数値の場合は、1〜9の値のいずれかとなり、それらは等頻度で表れる
  • 2桁の数値の場合は、10〜99の値のいずれかとなり、先頭が「1」から「9」になる数値は等頻度で表れる。
となるが、3桁の数値の場合は、100〜n**の値のいずれかとなるので、nが小さければ小さいほど、「1」で始まる数値が多くなると言える。例えば、最大値が499であったとすると、「5」から「9」で始まる3桁の数値は存在しないので、その分、「1」から始まる数値が相対的に多く出現することになる。

 西暦や平成の数値も同様である。西暦元年以降の最大値は今年で2015となっており、このうち西暦1000年から1999年が半数近くを占めている。平成の場合も、平成27年までのうち、平成1年と11年から19年までの11/27が「1」から始まっている。

 もちろん、何らかの測定値の場合は、正規分布、二項分布、ポワソン分布、...というように何らかの分布に依存することが多いので、必ずしも上記の通りにはならない。とはいえ、日常生活のあらゆる数値を手当たり次第にメモしていけば、「1」で始まる数値が多いということに気づくであろう。

 しかし、上記の理由以外にも、「1」で始まる数が多くなり理由があるようだ。じつは、この話題を唐突に取り上げたのは、アンテナ経由で拝読しているこちらのコラム(「その2」となっているが、「その1」の誤植のようだ)で、ベンフォードの法則が紹介されていたからである。リンク先のウィキペディア該当項目には、電気料金の請求書、住所の番地、株価、人口の数値、死亡率、川の長さ、物理・数学定数、冪乗則などがあてはまると紹介されていた。ちなみにこの法則は、比率に多少の差はあるものの、位取り記数法である限りは、十進数以外でも成り立つ。

次回に続く。