じぶん更新日記・隠居の日々
1997年5月6日開設
Copyright(C)長谷川芳典



02月のインデックスへ戻る
最新版へ戻る

岡大構内でも梅の花が開き始めた。写真は時計台近くの紅梅。すぐ近くには白梅もあるが、そちらのほうはまだ蕾状態。


2022年2月10日(木)



【小さな話題】n個石が入っている袋から1個以上無作為に取り出したとき、偶数個と奇数個どちらの確率が高い?(その2)二項分布か一様分布か?

 昨日に続いて、

●n個石が入っている袋から1個以上無作為に取り出したとき、偶数個と奇数個どちらの確率が高い?

という問題と、それに関連した「無作為」の意味について考察する。

 昨日は、「無作為」という意味を、

●袋の中に入っているn個の石はそれぞれ等確率で独立して選ばれる。

というように解釈し、かつ、選ばれる確率は1/2であると仮定していた。この条件のもとでは、n個の中からxp個が選ばれる確率は、二項分布に従う。例えば、袋の中に10個の石が入っていた時、そこからx個(0≦x≦10)が取り出される確率は、こちらのような分布になる。但しp=0は当てはまらないので、その確率を除いて再計算する必要がある。

 昨日の終わりのところで少しだけ言及したが、選ばれる確率が1/2以外の時の分布はこちらに示されるように、非対称になる。
 例えば、10個の石が、それぞれ0.9の確率で選ばれる時に選ばれた個数がx個になる確率は、
  • 10個:0.349
  • 9個:0.387
  • 8個:0.194
  • 7個:0.057
  • 6個:0.011
  • 5個:0.001
  • 4個以下:ほぼゼロ
元の問題は、奇数個と偶数個の確率の比較にあったので、それぞれを合計すると、奇数個(9、7、5、3、1)が選ばれる確率は0.445、偶数個(10、8、6、4、2)選ばれる確率は0.554となるので、私の計算に間違いが無ければ、偶数個選ばれる確率のほうが大きくなることが分かる。
 逆に、10個の石がそれぞれ0.1の確率で選ばれる時に選ばれた個数がx個になる確率は、上記の個数を10から引いた値となり、
  • 0個:0.349
  • 1個:0.387
  • 2個:0.194
  • 3個:0.057
  • 4個:0.011
  • 5個:0.001
  • 6個以上:ほぼゼロ
となる。この場合、奇数個(9、7、5、3、1)が選ばれる確率は0.445、偶数個(10、8、6、4、2)選ばれる確率は0.205となって奇数個選ばれる確率のほうが大きい。n=10の場合、奇数個選ばれる確率というのは奇数個選ばれない確率と同じことなので、奇数個=0.445というのは計算しなくても分かる。いっぽう、偶数個選ばれる確率が減っているのは、「0個選ばれる確率」を除外しているためである。

 いずれにせよ、選ばれる確率pが1/2よりも大きい時は、条件によっては偶数個選ばれる確率のほうが大きくなることがあるように見える。いっぽう、pが極めて小さくなると、0個や1個だけ選ばれる確率が増大していくが、「0個選ばれる」が除外されるため「1個選ばれる確率」がきわめて大きくなり、結果的に「1個」を含む「奇数個選ばれる確率」のほうが「偶数個選ばれる確率」よりも大きくなるものと推測できる。




 さて、ここで、もう一度「無作為」の意味を考えてみることにしよう。ウィキペディアによれば、
無作為抽出(random selection)は、ある項目を選択する確率が母集団内におけるその項目の割合と一致している集団から項目を選択する方法である。
と定義されているようである。であるならば、以下のような取り出し方でも、無作為に取り出すことになるのではないだろうか?

●まず取り出す個数をランダムに決めた上で、袋の中をよく混ぜて、その個数分を無作為に取り出す。

具体的には、

●袋の中の石の数をn個であるとする。1からnの数が書かれたn枚のカードを用意する。カードをよく切って1枚を取り出し、書かれた数と同じ個数を取り出す。

という方法が考えられる。この場合、いくつ選ぶかはランダムに決められているし、袋の中をよく混ぜているので、どの石が取り出されるのかは等確率になる。これが無作為でないとしたらどこが間違っていると言えるのだろうか。

 すでに述べた方法と、この新しい方法との違いは、「x個選ばれる」というxの確率分布が、前者では二項分布、後者では一様分布(矩形分布)になっているところである。二項分布ではこちらに示されているように、例えば、10個が入った袋から1〜10個が選ばれる確率の大きさは山形になっていて、5個選ばれる確率が最も高い。いっぽう一様分布では、1〜10個が選ばれる確率はすべて1/10になる。

 もっとも、一様分布だからといって、奇数個、偶数個選ばれる確率が同じということにはならない。なぜなら、離散的な一様分布では、nが奇数個の時は、上記でいう1〜nを記したカードのうち、奇数を記したカードのほうが1枚多くなっている。例えば、スペードのカード13枚から1枚を取り出す時に奇数が出る確率は7/13であり、偶数が出る確率6/13よりも大きい。

 ということで、「1〜nの書かれたn枚のカードから1枚を取り出す。奇数、偶数どちらのカードが出るほうが多いか?」という問題が出された時には、
  • nが奇数の時は、奇数が出る確率のほうが大きい。
  • nが偶数の時は、半々。
と答えるのが妥当。nが奇数か偶数か分からない時は、「分からない」という意味を「nが奇数か偶数かは半々である」と解釈すれば、上記の両方を合わせることになるので、奇数のカードのほうが出やすいということになる。

 次回に続く。