• データマーケティング
  • 2015-01-20

Monthly pageview: 0


セグメンテーションのための統計解析(1)―階層的クラスター分析―

マーケティングにおいて,セグメンテーションが重要性であることは言うまでもない。では,どのようにして顧客・消費者を分類することが適切であろうか。ここでは,セグメンテーションのための統計解析法として階層的クラスター分析を紹介する。

1 視覚的な方法によるセグメンテーション

直観的で分かりやすい分類を行う方法として,はじめに視覚的な方法を取り上げる。図1には,平均購買金額に関する5千人分のデータを,200円ずつで区切って区間を作り(例えば,2000~2200,2200~2400など),各区間に含まれる人数(度数)を縦棒で表した図を示す。この図はヒストグラムと呼ばれる。図1のヒストグラムより,3000~3200円の区間に含まれる人は約180人おり,3000円前後で度数が一度多くなっていることが分かる。また,5000円前後と8000円前後でも度数が高くなっており,3箇所で度数のピークが見られる。ここから,平均購買金額が約3000円のグループと,約5000円のグループと,約8000円のグループに分割することができる。

 

購入調査グラフ「
図1 平均購入金額に関するヒストグラム

次に,平均購入金額と購買回数に関する5人分のデータを,同時にプロットした図を図2に示す。Aさんは購買回数8回,平均購買金額6500円であるため,横軸の8回と縦軸の6500円の交わるところにプロットされる。このように2つの変数(指標)に関して同時にプロットした図は散布図と呼ばれる。散布図を観察すると,プロットの近いCとEは比較的似ている顧客であると考えられる。同様に,BとDも類似した顧客であると考えられるが,Aは他の4人とは異質な存在であることが示唆される。

このように,データをヒストグラム(1次元)や散布図(2次元)によって表現することで,視覚的な分類を行うことができる。顧客管理の実現に向けた知見を獲得するための第1ステップに位置付けられるRFM分析(照井・佐藤,2013)においても,「Recency(最新購買日)」「Frequency(累積購買回数)」「Monetary(累積購買金額)」という3次元空間に顧客をプロットし,分類を行う。グループ分けをすることができれば,グループの特徴を考慮して効率的なマーケティング活動を行うことが可能となる。

マーケティング実務での経験や知見を活かして,特定の変数に注目して視覚的な方法で顧客を分類することは重要である。しかし,その際に考慮できる変数の数は限られており,候補となる変数が多くなると合理的な分類は難しくなる。属性やライフスタイル,ブランドイメージや価値観など,購買以外の顧客情報も考慮して分類を行う際には,視覚的な方法では限界があり,多変数を同時に分析して顧客をグループ分けする必要がある。そのための手法の一つが,階層的クラスター分析である。

Ikehara1_g2
図2 平均購入金額と購買回数の散布図

デンドログラム
図3 デンドログラム

2 階層的クラスター分析

階層的クラスター分析は,対象(顧客)間の類似性を利用して,似ている対象どうしを順々に集めてセグメント(クラスター)を作っていく手法である。ここで対象間の類似性として,2つの対象間の距離を利用する(注)。図2の散布図において,AとCの距離よりも,CとEの距離の方が近いことは直感的に理解できる。これを多変数に拡張し,複数の変数を利用して2つの対象の類似度が計算される。
複数の対象間の距離を計算した後に,互いの距離が最も近くなる対象(図2ではCとE)を見つけ,それらを1つのクラスターに統合する。この処理を,すべての対象が1つのクラスターに統合されるまで繰り返す。最終的には,図3に示したデンドログラムと呼ばれるクラスター併合の過程を表した図が出来上がる。図3は,図2で示した平均購入金額と購買回数に関するデータから作成されたデンドログラムである。デンドログラムの縦軸は距離を表し,距離の近い対象どうしが順次併合される。はじめにCとEが併合され,次にBとDが併合される。続いて{C,E}と{B,D}が併合され,最後にAと統合する。デンドログラムは,任意の高さで切断することで複数のグループに分割することができる。例えば,2.0の辺りで切断すると,{A},{C,E},{B,D}という3つのセグメントを構成することができる。
ここでは,2変数の場合の分析結果を示したが,もちろん多変数の場合でも階層的クラスター分析を実行してデンドログラムを作成することができる。多様な顧客を理解するための第一歩としてセグメンテーションは非常に重要であり,複数の顧客情報を利用した階層的クラスター分析はその一助となるであろう。

<注>
2変数の場合,対象と対象のユークリッド距離は,対象と対象の座標を,ととしたときに,以下の式で定義される。
Ikehara1_g4

距離が近いほど類似しており,遠いほど似ていないということになる。多変数の場合(個の場合)には,上式を拡張させて,以下のように定義する。
Ikehara1_g5

<参考文献>
・照井伸彦・佐藤忠彦,2013,現代マーケティング・リサーチ 市場を読み解くデータ分析,有斐閣


BIツールの導入から運用の考え方 全員無料プレゼント

このE-Bookは、攻めのマーケティングでのBIツールの使い方、BIツールの可視化仕様の一提案の記事について、オリジナルの図解で解説したものです。自社の事業特性に合わせてご活用ください。
ダウンロードはこちら(無料)

このコラムバックナンバー ─コラム記事─

あわせて読みたい ―関連記事―