じぶん更新日記

1997年5月6日開設
Copyright(C)長谷川芳典



07月のインデックスへ戻る
最新版へ戻る


 気象庁は7月8日、岡山を含む中四国地方が梅雨明けしたとみられると発表した。平年(7月21日)より13日早く、1951年の統計開始後で4番目に早いという。

 写真は、梅雨明け日の夕方、夕日を浴びる岡山市内。遠くのビルが夕日に照らされているのに対して、手前はすでに日が当たらず暗くなっている。太陽が北西方向に沈むために、半田山の影がのびる津島地区のほうが早く暗く日が暮れるためと思われる。だからといって早く涼しくなるわけではない。ちなみに、7月8日の岡山は、午前10時から22時まで12時間にわたって30℃以上の暑さが続き、1日の平均気温が30.3℃で、この夏初めて30℃を超えた。


2013年07月8日(月)

【思ったこと】
130708(月)クローズアップ現代:数字のカラクリとビッグデータのちぐはぐさ

 他の話題を取り上げていたために遅くなってしまったが、7月3日放送の

NHKクローズアップ現代:数字のカラクリ・データの真実  〜統計学ブームのヒミツ〜

について、備忘録代わりにコメントさせていただく。ちなみに、最近では、クローズアップ現代は「放送した内容すべてテキストでご覧いただけます」という「放送まるごとチェック!」があるため、いちいち録画再生しなくても済むようになってまことにありがたい。今回の内容は、こちらから全文を閲覧することができる。

 さて、番組記録サイトにもあるように、この日の話題は、
今、統計学がブームを巻き起こしている。出版界では入門書が5か月で26万部の大ヒット。都心の書店では統計学コーナーまで設置され、公開講座にはビジネスマンを中心とした受講生が殺到。そして、統計学を使いこなす「データサイエンティスト」と呼ばれる専門職は「最もセクシーな(魅力的な)職業」だとして、多くの企業から引く手あまたの状況だ。一体、人々は何を統計学に求めるのか。【以下略】
となっていて、「ビッグデータをどう扱うのか」や「データサイエンティストがなぜ求められているのか」を紹介することが目的であったようだ。

 しかし、番組冒頭では、

買い物客で、にぎわう商店街。
街の人たちに、ある質問をしてみました。
ある食べ物を食べることを禁止すべきか、という質問です。
心筋梗塞で死亡した人の95%が、この食べ物を摂取していた。
そして、がん患者の98%。
強盗など、凶悪犯罪者の90%が犯行前、24時間に摂取していた食べ物。
これは禁止すべきか否か。
というクイズが紹介された。うーむ、これって、統計学というより、クリティカルシンキングのネタじゃないのかなあ。

 上掲と似たような問題としては、DHMO(ジハイドロジェン・モノキサイド)とは何かというクイズがある【いくつかバリエーションがあり、下記はその1つ。】
  • この物質は、常にわれわれの生活を脅かし、多くの人々の命を奪っている恐怖の物体である。
  • 無味無臭、無色透明の化学物質である。液状のDHMOを口や鼻から吸引すると、窒息してしまう。それによる死亡事故は非常に多い。 また、嚥下した場合、発汗・腹部膨満感・吐き気・嘔吐などの症状を引き起こし、中毒症状を起こすと、ひどい時には死にいたる場合がある。
  • DHMOは、気温によって形状を変化(気体・液体・固体)させる。固体の状態のものに長時間触れ続けると、身体組織に深刻なダメージを受ける。
  • DHMOは酸性雨の主成分である。
  • DHMOは大規模な工場の冷却用に多量に用いられ、原子力発電所などでも運用されている。して、軍隊がこの物質を用いて軍事作戦を行うことは、現代では常識である。駐留米軍も大量にDHMOを備蓄しているが、この事実を日本政府は黙認している。
  • この物質は、世界中のいたるところで我々を死の淵へ引きずり込もうとしている、恐ろしい物質である。なのに、誰もこのことを公にし、使用している団体に抗議したり、危険を訴えたりしないのだ。
  • いま、この物質の恐ろしさを知ったあなたは、是非この物質の使用を中止し、安全な生活を送ってほしい。私は、それを切に願うのだ
今回の番組では確かに、「心筋梗塞で死亡した人の95%が、この食べ物を摂取していた。そして、がん患者の98%。強盗など、凶悪犯罪者の90%が犯行前、24時間に摂取していた食べ物。」というように、統計っぽく数字が使われているが、このトリックでは数値の大小はあまり関係が無い。仮に、このくだりを、「心筋梗塞で死亡した人の大多数は、この食べ物を摂取していた。殆どのがん患者も同様。強盗などの凶悪犯罪者でも、前日以降にこれを摂取していた比率がきわめて高い。」というように数値無しのくだりに置き換えても、ひっかかる率は殆ど変わらないのではないか。要するに、多くの人が引っかかるのは、数字のトリックにひっかかったのではなく、ある種の認知の枠組が与えられて、それに都合の良い情報ばかりを寄せ集めて提示されたために、「これは危険だ」というように誘導されてしまったにすぎない。

 であるからして、昨今ブームと言われる統計学の入門書を読んだところで、あるいは、「データサイエンティスト」の仕事内容を知ったところで、騙されることが無くなるようになるとは思えない。こういうものに騙されなくなるには、まずは、クリティカルシンキングの入門書を読むべきだと思う。

 番組では続いて、
  • (合格者発表前に)学生マンションの申し込みをした受験生の合格率は72%を超えている
  • ダイエットの成功率(画像のみ)
などに言及されていたが、これも結局はクリティカルシンキングの範疇。統計学の入門書を読めば騙されなくなるというものではなかろう。

 その次の話題は、プロ野球でボールがひそかに変えられ、ホームランの数が増えたという、統一球問題をカイ二乗検定で検証しようというような話題、さらにはスタジオで紹介された、「日本人の1世帯あたりの貯蓄額の平均値が1664万円」というような話題。このあたりは統計学の基礎の話題とも言えるが、うーむ、ここまで来ても、番組後半の話題には繋がらないように思えた。

 でもって、後半はデータサイエンティストの話題ということになるわけだが、番組では、それらの手法が世の中に役立つというスタンスで肯定的に紹介されていたように思う。しかし、2008年9月のリーマンショックにしても、サブプライムに関わる数理モデルの応用に想定外の事態が発生したことが原因ではなかったかなあ。ビッグデータの適切な処理が、効率的な宣伝活動、集客などに役立つことは示唆されていたが、もう少し、世のため、人のためになりそうな応用事例を紹介してもらえるとよかった(←そんなの、儲からない?)。

 ま、どっちにしても、私なんぞは、おおぜいの人たちが関心をむけるような話題には殆ど興味が無く、人混みも嫌い、コマーシャルも大嫌い、ということで、どうせ、ビッグデータの外れ値となってしまうのだろう。ま、私自身は除外されるとしても、個々人を大切にしてほしいということは譲れないところだ。ビッグデータの利用が進めば進むほど、個々人の個性や、個人の世界の中でも意味づけのようなものが大切になってくるかもしれない。