じぶん更新日記

1997年5月6日開設
Copyright(C)長谷川芳典



03月のインデックスへ戻る
最新版へ戻る

 3月8日の岡山は朝6時台から17時台まで雨が降り続き、1日の合計降水量は31.5ミリとなった。
その後低気圧の移動に伴い、西の空の雲が切れて美しい日没風景を眺めることができた。

2016年03月09日(水)


【思ったこと】
160309(水)さらば?p値統計学

 各種報道によると、アメリカ統計学会は7日(現地時間)、有意差検定やp値に関して、正確な使用と解釈を求める声明を発表したという。

 ネットで検索したところ、原文はこちらにあり、以下の6点が指摘されている。
  1. P-values can indicate how incompatible the data are with a specified statistical model.
  2. P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.
  3. Scientific conclusions and business or policy decisions should not be based only on whether a p-value passes a specific threshold.
  4. Proper inference requires full reporting and transparency.
  5. A p-value, or statistical significance, does not measure the size of an effect or the importance of a result.
  6. By itself, a p-value does not provide a good measure of evidence regarding a model or hypothesis.

※心理学などで有意差検定を行った場合のpは通常、小文字で表記するが、上掲の箇条書きで文頭にpがある時は大文字で表記されている。

 ネットで検索したところ、日本国内でもいくつか関係者から反応があった【こちらこちらなどなど】。

 上掲の声明で1つだけ気になったのは、

2. P-values do not measure the probability that the studied hypothesis is true, or the probability that the data were produced by random chance alone.

という部分。上掲のブログでは、

p値は「その仮説が真である確率」は与えないし「ランダムな偶然だけからそのデータが得られる確率」も与えない。

と訳されているが、下線部のところがちょっと引っかかった。というのは私は従来より、

p値は, 帰無仮説が真のもとでの “観測値の出現率" を計算しているにすぎない.」

と理解しており、これが否定されているような印象を受けたからである【例えばこちら】。

 念のため、英語が堪能な某家族にもメールで問い合わせてみたが、「p値はその仮説が真である確率を表す訳でも、全くの偶然によって(バイアス等の影響を受けず)そのデータが得られた確率を表す訳でもない」という答えが返ってきた。

 では、声明文で否定されていることと、私の従来の理解とどこが違うのか。ウィキペディアの当該項目を参照すると、

帰無仮説の下で実際にデータから計算された統計量よりも極端な統計量が観測される確率を、p値という。

となっており、どうやら、従来の理解の前提となっている「(確率分布や分散についての仮定を含む)帰無仮説が(真の)もとで」と、声明で否定されている「全くの偶然によって(バイアス等の影響を受けず)」という部分が違っていると考えるべきであるようだ。このほか、サンプリングに偏りがあればp値は当然その大きさを反映するので、母集団から全くの偶然によって(バイアス等の影響を受けず)そのデータが得られた確率とは言いがたいという見方もできる。

 なお、声明自体については、昨年12月10日の日記および翌日以降で、ベイズ的アプローチに関連して考えを述べたことがある。

 今後、日本国内でも、統計教育や、有意差検定ばかりに頼った研究のあり方に大きな影響を与えることになるだろう。