Recent Entry
Archives
Back Number
Tag Cloud
検索
 

リサーチ道場 第39回「「%」ではない、「実数」のデータに存在意義はあるのか?」

2018/02/27

タグ:牛堂雅文 実数データ 件数データ

株式会社ジャパン・マーケティング・エージェンシー
 企画部 ディレクター 牛堂雅文 


集計した調査データには、回答の割合が分かる「%データ」と、実際の回答件数(人数)が分かる「実数データ(件数データ)」の2種類があることをご存知の方も多いかと思います。

「%のデータ」だけでよいのに、なぜわざわざ「実数データ」まで送ってくるのか?と思われた方も多いかもしれません。この「実数データの存在意義」はどのあたりにあるのでしょうか?今回はこの地味かつ、ある瞬間には大変ありがたい存在となる「実数データ」に迫ります。

一部の方が「耳にタコができる」ほど聞いたことのある理由以外にも、別の理由も存在します。

Image 1.png


■なぜ、「実数データ」が調査会社から送られてくるのか?

ほとんどの方は、集計データや報告書を見て、「認知度は何%、購入意向は何%、満足度何%」といったことを「%」で把握、あるいは「ウェイトを与えた平均値」を利用し、それで事足りているのではないでしょうか?

「実数データがなぜ送られてくるのか?」…この問い対する答えとしてよく言われるのが、「サンプルサイズが少ないときに標本誤差に気が付きやすいよう実数を見る」という話です。これが「耳にタコができる話」の方です。

具体的に言うと「30%といっても実は【10人中の3人】か…かなり誤差がありうるな」…ということで、誤った判断をしないように用いられます。「30%」という数字単独では、「1000人中の300人」か、「10人中の3人」かまでは分かりません。

もちろん、左横あたりに書いてある「集計ベース」を見れば「何人中」という方はすぐに分かります。ただ、実数データであれば、「30%が3人か、300人か」ということは計算をするまでもなく一目で判断できます。


■%、実数の併記もできる…が

とはいえ、大半の方は「%データ」を重視します。そこで、%も実数も同時に見られるよう、「実数、%併記」という集計表も存在します。上段、下段の2段にデータが入り、片方に実数、もう片方に%のデータが出力されます。(横パーセント表記の場合)

Image 2.png


この「併記」というのは一見便利そうな気もします。ただ、集計の先の作業である「グラフ作成」や、「特徴的なデータへのマーキング」などの後工程を考えると、かなり邪魔といいますか見た瞬間に気持ちが萎える書式でして、個人的には「実数、%併記」を全く使用していません

併記のものを下手に使用すると、「%」であるべきデータに間違って「実数」を入れてしまう可能性すらあり、ハイリスクな状態となります。「実数、%併記」を勧めて頂いた諸先輩方、全く使っておらず本当に申し訳ありません。



■少し別の話、「集計ベース」を変更する場合

お待たせいたしました。では、ここからが「耳にタコができない方」の話です。

例を挙げて話を進めます。「ブランドAを知っている人」に「ブランドA」のイメージを聞くという質問の仕方があります。

1000人中60%の600名が「ブランドA」を知っていて、そのうち50%(300名)の人が「ブランドA」は「楽しそう」というイメージだった…という調査結果があったとします。
「ブランドA」が「楽しそう」というイメージは5割です。

しかし…その解釈はあくまで「ブランドA」認知者の中での話です。そもそもブランドAを知らない方もいるので、「知らない方」も含めた全体の中では「1000名中の300人」ですから、「楽しそう」というイメージは「30%」だという話になります。

非認知者も含めた全体ベースの数字は、色々なブランドを比較する場合などで、ブランドを知らない人も含めて一律で見てしまうような時に用います。

全ベース、認知者ベース.gif

このように「○○な人だけに質問していく形式」の場合、その質問の回答者が全体の1000人より減り、集計ベースとなる人数が少なくなりますので、認知者で「50%」であっても、全体から見れば「30%」に過ぎないという現象が起こります。


■実数の出番【1】集計ベースの変更

「ブランドA」を「楽しそう」と感じているのは、「30%なのか、50%なのかどっちなんですか?」という疑問が持たれそうです。当然「どちらも正しい数字」であり、基本的には「認知者で数字を見る」などと、どう見るか統一し混乱を防ぎます。

一方、全体(1000s)でもデータを把握しておこうと補助的に、後から「集計ベース」を変えて全体で「30%」という数字も算出したくなります。

大変お待たせしました。そうです、ここで「実数データ」が本領を発揮します。

「実数のデータ300人を、全体の数字1000人で割る」という数式を作って計算すれば、一瞬にして「全体ベース」での集計が行えてしまいます。(%とする場合は×100を忘れずに数式に加えて下さい。)
「実数データ」があればこの300人に限らず、集計表上にある色々な数字で「集計ベース」を変えての%データが算出できてしまいます。



■実数の出番【2】四捨五入など「小数点以下のズレ」に強い

「集計ベースは変更しないな」…という方も、いらっしゃるかもしれません。
しかし、「実数データ」にはもう一つのメリットがあります。それは、いくつかの%データを足す、引くときにおこる、「小数点以下のズレ」が起きないというメリットです。

「そう思う」22.3%+「ややそう思う」17.6% = 39.9%といった計算をすることがあるかと思います。

その際、小数点以下は四捨五入で端数処理されるため、本当は「22.3469…%」であったものが「22.3%」と端数処理されます。そして、端数処理されたものが足されたりして積み重なり、段々不正確さが積みあがることがあります。(厳密にはどこを端数処理すべきか…という有効数字(有効桁数)というものがありますが、今回はそこには踏み込まずに話を進めます。気になる方はぜひ検索などしてみてください。)

集計ソフトで計算すると「そう思う」の合計は「40.0%」になるはずなのに、個別の「%」のデータを後から足すと「39.9%」になる…、「あれ、0.1ポイントずれている!」という怪現象です。これは計算自体は全く間違えていませんし、大きな問題というよりは、「少し気持ち悪い」という程度の話ではあります。

Image 4.png


全部足すと「100%」になるはずの計算なのに、全部足しても「99.9%」にしかならない、逆に「100.1%」と100%を超えるといったケースを経験した方もいるかと思います。これも同様に計算は正しいのですが、「少し気持ち悪い状態」と言えそうです。

この「気持ち悪さ」を回避する方法としては、先に「実数データ」で足したり引いたりして必要な数字を出し、最後に全体などで割って「%」に計算すると、四捨五入が最後の一度で済みこういったズレが起きません。

数学で、小数にしてから計算を進めるのではなく「分数のまま計算する」ことで、端数処理されず正確に計算できるという話を昔聞いたような気がしており、まさにその使い方であると言えそうです。

これも使用機会は少ないかもしれませんが、「実数データ」が大変有意義になる瞬間です。


■あってよかった「実数データ」

このように、通常はほとんど使用しない「実数データ」ですが本当に役に立つ瞬間があり、「あってよかった実数データ」と思うことがあります。

「また、実数データなんて余計なものを送ってきたな…」と感じられるかもしれませんが、意外と活用法がある、ということをお伝えできていましたら幸いです。