Recent Entry
Archives
Back Number
Tag Cloud
検索
 

ベイズ統計ってなに? 第2回「伝統的統計手法の限界」

2010/12/09

タグ:上田 牧人 ベイズ統計

株式会社ジャパン・マーケティング・エージェンシー
企画部 大阪事務所 マネージャー 上田 牧人

統計学の分類


統計にもいろいろありまして、下図のように、ベイズ統計は伝統的統計と同じ推測統計学のジャンルに入ります。
今日は伝統的統計の方を簡単に述べてみたいと思います。ここで言う伝統的統計とは、フィッシャーやネイマンが基礎を確立し、標本理論や統計的仮説検定など従来標準的な「統計学」として語られてきた体系を指します。

ベイズ統計の位置づけ.gif


伝統的統計の役割


伝統的統計学は近代産業社会において、品質管理などでおおいに貢献しました。
例えば、食品工場で抜き取り検査はどの程度必要でしょうか。口に入るものですから不良が1個も許されないとしたら、本当は全数検査しなければ証明されません。

仮に10万個作ったとして、全部検査にまわしたら売る商品がなくなってしまうので困ります。ならば統計的に95%の信頼性が得られれば良しとしようと考えると、必要な抜き取り個数は3000個ということになります。これでも多すぎると現場から文句が出るかもしれませんが、不良率0%という縛りなので致し方ありません。


社会調査でのエポックメイキングは、ギャラップ社の世論調査でしょう。1936年アメリカ大統領選挙において、ギャラップ社は大方の予想に反してフランクリン・ルーズベルトの再選を的中させました。統計的な標本抽出理論を使ってランダムサンプリングした結果でした。

マーケティングの分野にもこうした統計的手法が取り込まれました。
余談ですが、奥さんの会話で「みんなそう言ってる」という主張は疑ってかからなければなりません。よくよく聞いて見ると『みんな』がご近所の3〜4人、それも親しい友達(=立場や考え方の似通った人たち)だったりします。

営業部門からあがってくる評判情報も、声の大きな仕入れバイヤーの代弁だったりすることがあるかもしれません。客観的に消費者の意見を押さえましょうということで、マーケティングリサーチが登場することになります。

一対比較の嗜好調査で、100人調べて60人:40人以上の差があったら統計的に勝ち負けが判定されます。それは次のような考え方に基づいています。

@ 帰無仮説として真の値が50:50で差がないという事象を想定します。
  帰無仮説が正しい場合、100人サンプリングして得られる支持比の確率分布が分かります。

A 危険率5%を採用するなら、60:40〜40:60の範囲におさまる確率が95%なので、
  それよりはみ出した結果が出れば最初の帰無仮説を捨てます。(有意差あり)
  範囲内の結果であれば、帰無仮説を捨てきれないので判断を保留します。(有意差なし)

もってまわった、慎重な、悪く言えばとても臆病な態度だと思いませんか。
しかし『有意差がなければ事実として認めない』というお約束は、マーケティングの現場で個人の暴走を食い止める一定の役割を果たしてきたのも事実でしょう。


伝統的統計の行き詰り


企業の現場では、以前ほどは検定など伝統的な統計手法が重視されなくなってきたような気がします。
そこにはいくつか理由があったと思います。

ひとつは社会環境の変化です。社会が成熟し多様化していくと、1組の平均値とバラツキではものが語れなくなりました。多様化する消費者ニーズに合わせて企業も市場セグメントと商品の多角化が関心事項となり、「平均ではモノは売れない」とまで言われるようになりました。

ふたつめは伝統的統計手法そのものの問題です。選挙と違って50%を1票でも上まわれば総取りできるという保証などまったくないなかで、検定理論における帰無仮説のような操作的概念はどう見ても不自然でした。また、「隠された真の値(母数)が不確かなうちは動くな」とする態度は、ますます過熱する市場競争に合わないものになっていきました。

みっつめはリサーチにおける事情です。低コストとスピードが要求されるとともに、やむなく標本抽出の中立性や統計的信頼性を犠牲にする調査が徐々に増えていきました。WEBリサーチの登場がその流れを決定的にしました。
少し前まで古いタイプの統計学者さんたちはそれを嘆いていましたが、今は誰も言いません。なぜなら、個人情報保護法により住民基本台帳の閲覧が自由にできなくなったので、教科書的な標本抽出調査は文字通り教科書のなかだけに封印されて、現実には実施不可能なものになったからです。


活路を求めて


真実の値(母数)を求めて、漸近的にそこに近付こうという意思はベイズ統計も伝統的統計も同じです。
片や伝統的統計が、目に見えない母数の方からみて推定される範囲に判断をとどめようとするのに対し、ベイズ統計の方は、得られる情報によって次々更新される事後確率を次のステップへの指針とします。
忙しい世の中では、ベイズ統計のこの割り切りが貴重なのかもしれません。

次回はベイズ統計の基礎となる『ベイズの定理』について説明したいと思います。