• データマーケティング
  • 2015-01-30

Monthly pageview: 11


統計数字の性質を知る―クロス集計表から分析結果を読み解く―

新聞や雑誌、テレビやインターネットなど、われわれの身のまわりには統計数字が溢れている。マーケティング場面においても、データから算出された統計数字や図表を参考に、比較や判断を行うことがあるが、それほど簡単なことではない。本記事では、「シンプソンのパラドックス」と呼ばれる統計的なパラドックスを紹介することで、統計数字の性質を知ることの重要性を示す。

1 クロス集計表

アンケート調査データや購買データなどを分析する際に頻繁に利用されるツールの一つとして、クロス集計表が挙げられる。クロス集計表は、2つの変数間の関係性を把握する際に利用され、統計ソフトを利用することで簡単に作成することができる。
ここでは、クロス集計表の例として、2つのダイレクトメール(DM)の販促効果を測定する場面を想定する。ある企業が2つのDM(DM1とDM2)を作成し、プレテストとしてそれぞれを150人に送付して、商品を購入するかどうかを検討したとする。この調査では、DMの種類(DM1、DM2)と購買行動(購入する、購入しない)の2つの変数に注目し、変数のカテゴリの組み合わせ(今回の場合は、DM1で購入する、DM1で購入しない、DM2で購入する、DM2で購入しないの4通り)に関して、人数が何人いるかを集計する。その集計結果を表にまとめたものがクロス集計表と呼ばれ、今回の例では表1のようになる。

表1 DMの種類と購買行動に関するクロス集計表
ikehara2_t1

表1より、DM1(44%=66÷150)よりもDM2(46%=69÷150)の方が購入してくれる人(割合)が多いことが分かる(注)。このクロス集計表から、DM2を実際の販促場面で利用するという決定を下してよいだろうか。

2 全体と部分で異なるクロス集計表

ここでは、視点を変えて、男性と女性に分けて、2つの変数間の関係性を検討してみる。その結果をまとめたクロス集計表が表2である。

表2 性別ごとの2変数に関するクロス集計表

ikehara2_t2

表2より、男性では、DM1(20%=14÷70)の方がDM2(18%=9÷50)よりも購買してくれる割合が高く、女性においても同様の傾向がみられる(DM1:65%=52÷80、DM2:60%=60÷100)。つまり、全体でみるとDM2の方が購買割合は高いが、性別で分けて分析するとDM1の方が割合は高くなるという全く反対の結果が得られることになる。このように全体(母集団)における関係性と部分(母集団を分割した集団)における関係性が異なることを「シンプソンのパラドックス」という。

ここで紹介した「シンプソンのパラドックス」は、データ分析によって得られた統計数字や図表をもとに行う判断・比較が、いかに難しいかを表している。今回の例では、性別という情報を無視してDM2を販促に利用するという判断を下した際に、期待される効果が十分に得られない可能性がある。データ分析によって有益な知見を得られることは多いが、それを正しく理解し活用していくためには、データがどのように得られたのか、どのような分析がなされたのか、また、実際に得られる統計数字や結果にどのような性質があるのかをきちんと知っておく必要がある。その知識は、ビジネス上の様々な意思決定場面において大いに役に立つであろう。

(注)割合の差に統計的に意味があるかについては更なる検討が必要である。


ベンチマークと分析の考え方 全員無料プレゼント

このE-Bookは、製品のデータマーケティングにおける大局観と具体化(1)から(3)の各セクションについて、オリジナルの図解で解説したものです。自社の事業特性に合わせてご活用ください。
ダウンロードはこちら(無料)

このコラムバックナンバー ─コラム記事─

あわせて読みたい ―関連記事―