• データマーケティング
  • 2015-08-11

Monthly pageview: 32


単回帰分析―予測するための統計手法―

回帰分析は,ある変数の値から他の変数の値を予測するために用いられる手法で,データ分析の場面で頻繁に利用されている。例えば,あるコンビニでは「品揃え」という変数で「コンビニの売り上げ」を予測することで,効率的な在庫管理を,また,あるテーマパークでは「宣伝広告費」と言う変数によって「来場者数」を予測することで,効果的な予算配分の実施を検討できる可能性がある。

このように,回帰分析は変数間の影響関係を検討する際に用いられ,マーケティング分野だけでなく,心理学や教育学,医療や農学など様々な分野で利用されている。回帰分析において,予測に利用する変数は予測変数と呼ばれ,予測される変数は基準変数と呼ばれる。本記事では,アメリカにおけるアイスクリームの消費に関するデータを例に,予測変数を1つのみ用いる単回帰分析について解説を行う(注1)。

単回帰モデル

1951年から1953年にかけて,アメリカで30回にわたって調査されたアイスクリームと消費量に関するデータを表1に示す(注2)。ここでは,一人当たりのアイスクリームの消費量(単位:ミリリットル)と平均気温(単位:度)が示されており,回帰分析を利用して平均気温から消費量を予測することを考える。本解説では,予測変数を「平均気温(x)」,基準変数を「消費量(y)」とする。

1507IkeT1

はじめに,2変数間の関係性を把握するために散布図を描くと図1のようになる。また,相関係数は0.776であるため,中程度の相関があることが分かる。図1の散布図より,左下から右上へ帯状に打点が散らばっていることが分かる。つまり,気温が高くなると消費量も上昇することが予想される。単回帰分析では,この2変数間の影響関係を
消費量=切片+回帰係数×平均気温+誤差
y=α+β×x+e  (一般的な表現)
のように1次式を利用して表現する。この式は単回帰モデルと呼ばれ,イコールの左側に基準変数y(消費量)が,右側に予測変数x(平均気温)が配置される。予測変数から基準変数への影響度合いは,回帰係数βによって表現され,回帰係数の符号とその大きさによって解釈がなされる。切片αは予測変数の値が0のときの基準変数の値を表す。また,基準変数は予測変数だけで予測できるのではなく,アイスクリームの価格や湿度など様々な要因から影響を受けると考えられる。そこで,予測変数では説明できない部分を誤差eによって表現し,影響関係を検討する。

単回帰分析の目的の一つは,単回帰モデルにおける切片αと回帰係数βの値を求めることである。切片と回帰係数を算出することで,次式によって,平均気温から消費量の値を予測することが可能となる。
消費量の予測値=切片+回帰係数×平均気温
y ̂ =α+βx (一般的な表現)
先ほどの単回帰モデルとは異なり,誤差項eが無くなっていることが分かる。この式は単回帰式と呼ばれ,この式を用いることで,散布図に2変数間の関係性を表す単回帰直線を描くことが可能となる。
実際に,アイスクリームの消費量に関するデータに単回帰分析を適用し,切片と回帰係数を求めると,値はそれぞれα=144.9とβ=2.65であった。よって,単回帰式は以下となる。
消費量の予測値=144.9+2.65×平均気温
y ̂ =144.9+2.65x (一般的な表現)
回帰係数は,予測変数が1単位変化した場合の予測変数の平均的な変化量を表す。つまり,平均気温が1度上昇すると平均的に約2.65ミリリットルのアイスクリーム消費量が増えるということが分かる。この単回帰式が2つの変数間の関係性を適切に表現した直線であり(注2),実際に図1の散布図に直線をあてはめると図2のようになる。また,単回帰式を利用することで平均気温からアイスクリームの消費量を予測することができる。例えば平均気温が20度だった場合には,消費量の予測値は以下のように約198ミリリットルと計算される。
消費量の予測値=144.9+2.65×20=197.9
以上のように,単回帰分析は,2つの変数間に認められる直線的な関係を1本の直線と用いて検討するための手法であり,予測や影響関係の検討に非常に有用である。

1507IkeT2

(注1)予測変数を2つ以上用いる分析は,重回帰分析と呼ばれる。
(注2)統計解析環境RのパッケージEcdatに含まれるデータIcecreamを利用する。なお,元データでは単位がパイントと華氏であったため,ミリリットルと摂氏に変換してデータを示している。
(注3)誤差の二乗和が最小になるという基準で切片と回帰係数を求めている。この方法を最小二乗法という。


BIツールの導入から運用の考え方 全員無料プレゼント

このE-Bookは、攻めのマーケティングでのBIツールの使い方、BIツールの可視化仕様の一提案の記事について、オリジナルの図解で解説したものです。自社の事業特性に合わせてご活用ください。
ダウンロードはこちら(無料)

このコラムバックナンバー ─コラム記事─

あわせて読みたい ―関連記事―