じぶん更新日記1997年5月6日開設Copyright(C)長谷川芳典 |
3月12日朝の日の出。3月6日(写真上)と比較すると1週間も経たないうちに、方位が左(北方向)に大きく移動していることが分かる。 |
【思ったこと】 160311(金)p値は「ランダムな偶然だけからそのデータが得られる確率」ではない 3月9日の日記で、アメリカ統計学会の声明の2.を取り上げた。「P-values do not measure the ... probability that the data were produced by random chance alone. (p値は「ランダムな偶然だけからそのデータが得られる確率」ではない)」というのは、いっけんあれっ?と思わせる記述であるが、p値というのはあくまで「帰無仮説が真のもとでの “観測値の出現率" を計算しているにすぎない.」というのが正しい解釈である。 このことに関連して、某家族からRetraction Watchに、こちらの記事が掲載されているとの情報が送られてきた。3月9日に私が取り上げたことに関連して、興味深いやりとりがあった。 2.P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.やはり、私以外にも素朴な疑問を持つ人がおられたようだ。 もっとも、この疑問は、両側検定と片側検定の違いを例に挙げれば簡単に説明できるということに気づいた。こちらの紀要論文(←サーバーの都合でアクセスできない時あり)でも指摘したように、 両側,片側のどちらを用いるかは,ほんらいデータを集める前に決めておくべきことである.両側検定をするつもりだったが,データを集めた後に平均がA>Bだったから片側検定にするなどというのは,検定の大原則に反する.結局、p値というのは、棄却域をどういう範囲に設定するのかによって変わってくるものであり、「帰無仮説が真のもとでの」という前提があってこその値ということになる。 なお、統計の仮説検定でいうp値とは、面積の大きさで決められるものである。例えば、コインを5回投げて4回表、1回裏になったとする。この結果から、このコインは(表裏の出る確率が1/2ではない)イカサマのために造られたコインであるかどうかを検討したとしよう。その場合、コインが5回中4回表になる確率ではなく、4回以上(5回中4回、もしくは5回中5回)という領域の面積比率がどれだけ小さいかどうかで議論される。 |