Recent Entry
Archives
Back Number
Tag Cloud
検索
 

リサーチ道場 その4「多変量解析って怖い?美味しい?」

2010/10/28

タグ:多変量解析

株式会社ジャパン・マーケティング・エージェンシー
企画部 牛堂雅文

多変量解析はなぜ近寄りがたいのか?


今までこのコーナーでは「シブヤ龍太郎のリサーチファイル」で話題になったリサーチについて解説していますが、今回は趣向を変えて「多変量解析」に焦点を当ててみます。

多変量解析は好きな方は好きで、そうでもない方は近づきもしないという、割と好き嫌いが明確に出る分析手法かもしれません。(すいませんが今回はベテランお断りとさせて下さい。)

多変量解析の本は例え「入門」と書いてあっても難解で、数式やなぞのギリシア文字が飛び交い、挫折しやすい分野でもあります。

それに加え、「多変量解析」は一つの体系だった学問と言うよりは色々な解析方法が集まった集合体であり、1章ごとに扱っている内容が全く違うこともよくあります。

多変量解析をよく使う方でも「因子分析はよく使うけれど、コンジョイント分析はさっぱり使わない。」といった偏った使い方になることが目立つのも事実です。

そういった背景もあり少々複雑に感じることもあるかもしれませんが、その世界に踏み入ってみると中々に魅力的です。

私の持論ですが、多変量解析の魅力は、【クロス分析でおぼろげにしか見えなかったことが、もっとハッキリ見えるようになる】ではないかと感じています。特に30〜40といった変数をうまく束ねて説明できる美しさはクロス分析にはない醍醐味だと思っています。

そのように一度「きれ味のいい多変量解析」を体験してしまうと、ズルズルとその魅力にはまってしまうものかもしれません。


多変量解析は何から学べばいいか?



本音を言わせてもらいますと「相関係数といった初歩を把握した後であれば、順番などにこだわらず好きなものから学べばいいのではないか」と感じていますが、それも不親切な気もしますので、稚拙で申し訳ありませんが私なりの意見を述べさせて下さい。

一番大事といいますか、使用頻度が高く、他の多変量解析とも組み合わせることができるマルチプレイヤーは「因子分析」だと考えています。「因子分析」は「クラスター分析」、「構造方程式モデリング(SEM)」にも使える、実に応用範囲の広い分析手法だと感じています。



因子分析とは


「因子分析」とは、「国語」「英語」「数学」「理科」「社会」といった成績のうち、「国語」「英語」「社会」に強い「文系能力」が強い人、「数学」「理科」といった「理系能力」が強い人がいる。この成績を分析して、測定できないが存在しそうである潜在的な「文系能力」「理系能力」といった【共通因子】を発見しようという発想で作られています。

因子分析.png

 
まずは、おおよそのイメージだけでも想像して頂けたら幸いです。

「僕は国語と理科はできた」、「英語と数学が得意だった」そんな反論もありそうです。
しかし、因子にも「文系能力」から「数学」にも少しは関係性があるように、全く2つの能力にバサッと断ち切られるわけではなく、因子との関係性の強さや弱さのグラデーションがあることに着目し、「関係性が強いということは、潜在的にこんな因子があるだろう・・・。」と読み解いていきます。

参考までに、「因子分析」には「因子負荷量」と呼ばれる1〜−1の間となる数字が出てきます。

これは「因子(文系能力など)」と「観測変数(国語、数学など)」の関係の強さを表すものでして、簡単に言ってしまえば「相関係数」です。



名前は違えど似ているアイツ


「相関係数といってくれれば分かるのに、なんでわざわざ因子負荷量とかって言うんだよ!」そんな声も聞こえてきそうです。

このように、似たようなものを違う言葉で呼んでしまうことも多変量解析を難しくしている原因の一つではないかと思います。逆に「実はこれとこれは似ている」と気がついたときに、多変量解析の理解が進んだ経験があります。

さらに言うと、多変量解析の本に数式が書いてある裏にはこういった事情もありそうです。数式を見ていると、「あれ?これどこかで見たことがある・・・○○にそっくりじゃないか!」という気づきです。

とはいえ、無理に数式を理解すべきだという話ではありません。数式を見ると何かいいことがあるかもしれない・・・くらいで捉えると良いかと思います。

色々書きましたが、多変量解析では、「この分析は何に使えるんだろう?」「何が得意なんだろう?」という部分を掴めれば、まずはOKなのではないかと感じています。



最後に


個人的に「多変量解析は包丁など、職人の使う道具に似ている」と考えています。刺身包丁は刺身を切るには最適でしょう。しかし、パンを切るとなると刺身包丁ではなくパン切り包丁の出番でしょう。

多変量解析も「この場合因子分析が良さそう。」「このケースではコンジョイント分析がいい。」「今回は多変量解析の出番はない。」といった使い分けをすると、初めてその真価が生きてくると考えています。

もちろん、料理同様に素材選び(調査票作成)などのステップである程度の見極めが必要なのは言うまでもありません。後付で行う多変量解析は少し怖いものです。

素材選びからはじめ、適切な包丁(分析手法)で、美味しい料理(切れ味のいい分析)を頂きたいものです。
2010/10/28
タグ:多変量解析
category:リサーチ道場