じぶん更新日記1997年5月6日開設Copyright(C)長谷川芳典 |
芭蕉の花、その後。 7月2日の日記に掲載した芭蕉の花のその後。「バナナ」部分はすでに黒くなってしまった。前回撮影時には気づかなかったが、右側のほうにもう一輪、花が咲いていた。朝、このあたりを通ると、クマゼミがもの凄い音響で大合唱している。 |
【思ったこと】 _80723(水)[心理]統計学初歩の授業をしていて思ったこと(2) 統計の初歩の授業で説明しにくい1つに、「片側検定」と「両側検定」がある。ウィキペディアの当該項目では、このことについては、 可能な全ての値の集合の中で、仮説に反する極端な範囲(分布関数をグラフ表示した場合には、裾に当たる部分)を選ぶ。これは検定統計量の危険域(Critical region)と呼ばれる。仮説が正しい場合に検定統計量が危険域内に入る確率を検定の危険率(有意水準あるいは検定のサイズともいい、ふつうαと表す)と呼ぶ。危険率として具体的には0.05(5%)、0.01(1%)などを用いることが多い。ちなみに、引用部分の最後にある「検定の種類によっては両側検定または片側検定のみということもある」という部分は、初歩の統計ではχ2 検定やF検定のことを指しているものと思われる。ネットで検索したところ、こちらに詳細な解説があることが分かった。 種々の解説書によれば、いっぱんに、「ある値より大きい」、あるいは「ある値より小さい」かどうかを検定するときは片側検定を、また「ある値と異なっているか」どうかを検定するときは両側検定を用いるとされている。要するに、何か関心事や疑問があった時には、「知りたい事と異なる」形で帰無仮説を設定し、それを棄却する形で対立仮説を採用するというロジックである。 例えば、ある不動産屋のチラシに「所要時間15分以内」という広告があったが、16回にわたり実際に所要時間を測ってみたところ、平均18分、標準偏差は5分であるという結果が得られたとする。この場合の関心事は、本当の所要時間が15分より大きいかどうかであって、それより短いことは問題にしない。つまり真の所要時間が12分であっても構わないのである。よってこういうケースでは片側検定を用いればよいだろう。 では、 高校生を対象に作られたある学力検査は、平均80点、標準偏差7点であることが知られている。25人の生徒に従来と異なる特別な教育法を実施したしたところ、平均点が83点であった。この教育法は学力向上に有効と言えるか?というケースではどうだろうか。確かに、実施者の関心事は、「学力の向上に有効かどうか」という点にある。しかし、この教育法は逆に学力を低下させるという主張をしている人がいたとする。実施者の関心だけを考えれば片側検定でよいが、教育法の是非をめぐる論争の場では、両側検定を行うべきではないだろうか。 この事例に限らず、薬の有効性、新製品の性能などを検定する時は、関心事が「片側」であっても「両側」で検定するのがフェアなやり方ではないかと思うのだがいかがだろうか。 片側検定は、研究者の関心の有無だけでなく、大小の方向性にある程度の裏付けがある場合に実施すべきであると私は思う。例えば、ある体力について、同じ学年の4月生まれと、翌年3月生まれの子どもで有意な差があるかどうかを検査したとする。この場合、4月生まれのほうが3月生まれの子どもよりも11カ月も前に生まれているので、体力が劣っているということは理論的に考えにくい。よって、関心事はどうあれ、片側検定を実施することが妥当であると考えられる。 なお、片側か両側かということと、第一種、第二種の誤りのリスクの大きさというのは別の次元の問題である。 |