じぶん更新日記1997年5月6日開設Copyright(C)長谷川芳典 |
休日も夜も賑わう岡山大学構内 こちらの案内にもあるように、岡大生協のマスカットユニオンの食堂は、この4月から、通常期に限り、土曜日・日祝日でも11:00から20:00まで営業されることになった。最近ではこのことが知れ渡ったようで、先日の「海の日」も、また22日の夜にも、かなりの人数が利用していた。写真は22日19時頃の食堂前の様子。試験前ということもあり、隣の図書館利用者も多く、道路上には多数の自転車が(迷惑)駐輪されていた。 |
【思ったこと】 _80722(火)[心理]統計学初歩の授業をしていて思ったこと(1) 今年度は種々のいきさつから、「心理統計学の初歩」(←実際には「初歩の初歩」のレベル)の授業を担当しているが、23日でいよいよ期末試験前の最後の授業を行うことになった。 統計学を教えるのは、かつて非常勤講師として、オーバードクター時代に専修学校で統計学の授業を担当して以来のことであり、概ね四半世紀ぶりということになる。コンピュータ利用の統計パッケージのほうは格段に進化したが、統計学の基礎的な考え方の部分は四半世紀前とはそれほど変わっていないように思う。 心理学として教えるべき内容が格段に増大したこともあり、心理統計の授業は、ともすれば、パッケージソフトの利用方法の伝授だけに終始してしまいがちである。かといって、基礎から徹底的に教えようとすると、他の専門授業が足りなくなり、ヘタをすれば統計解析の専門家養成課程になってしまう。このあたりは、それぞれの大学で苦労されていることと思う。 さて、久しぶりに統計学の各種入門書を参照して改めて感じたのは、取り上げられている例題があまりにも現実離れしているということであった。数学の練習問題としてはそれでよいのかもしれないが、非現実的な仮想の事例ばかりで練習していると、現実のデータにちゃんと向かい合えないのではないかという気もしてくる。 例えば、「検定」の初歩のところでは、母集団の平均や分散が既知か未知かによって、zの値を計算するか、t検定をするかといった場合分けをするように解説されているが、現実問題として、母集団の平均や分散が既知ということは本当にアリなんだろうかという疑問が出てくる。むしろ「母集団の平均や分散が既知」というのは、仮想の比較対象であり、「既知」というよりも「想定」あるいは「理論上の期待値」と言ったほうがよいのではないかと思ってみたりする。 では現実に、「母集団の平均が既知」としてどんな事例が挙げられるだろうか。表と裏が1/2の確率で出るという「理想的なコイン」などは、その事例の1つとして妥当であろうと思う(但し、この場合は二項検定)。 でもって、ある国で発行されているコインには、表面と裏面に異なるデコボコがあって、このコインを使うと表が出やすくなるのではないかという疑いが生じた。そこで実際に100回投げてみたら表が60回出た。このコインが、1/2の確率でランダムに「表」「裏」という二項乱数を発生させる装置として利用可能であるかどうかを検定する...ということになったとする。 この場合、ここでの関心事は、そのコインが確率1/2の二項乱数の発生装置として利用できるかどうかに絞られている。そのコイン自体には、0.51の確率で表が出るといった独自の二項分布をとることが推測されるが、それは当面の関心事ではない。 ある入門書にはこんな事例があった(文章や数値は改変)。 ある会社で所有している自動車の燃費は1時間あたり平均12.3km/リットル、標準偏差1.4という生産能力を持っている。新型車を導入するかどうかを検討するため、試験的に新型車14台を使ってみたところ、平均は13.3km/リットルであった。この新型車を導入したほうがよいか?これは、母平均と母分散が既知の事例として扱われる。しかし、ちょっと考えてみると、新型車でテストしたなら、とうぜん、平均値ばかりでなく標準偏差も算出できるはずだ。仮に、新型車の標準偏差が1.7であるという結果があとから分かった時はどうすればよいのか。これもおそらく、何を目的として検定を行うのかというニーズに依存しているように思われる。 つまり、もしその会社が本格的に新型車を導入しようと検討しているのであれば、従来車との群間の比較として検定を行うべきであろう(従来車については、使用年数も考慮して測り直す)。その場合、平均値の差だけでなく、分散の大きさも考慮しなければならない。分散が大きいということは、トラブルの原因になるかもしれなからである。 いっぽう、従来車と同じ設計の車が、コストを下げた生産ラインから新型車として販売されたとする。この場合は、性能は同一であるという前提があるから、従来車を母集団と見なして検定すべきということになるかと思う。 次回に続く。 |