重回帰分析を図解でざっくりと理解しよう!

図解で分かる重回帰分析【前編】〜「ざっくり」と理解する〜

重回帰分析は比較的理解がしやすく、一定の理解度があれば汎用的に使える分析方法です。しかし、これを独学で学ぼうとすると、色んな専門用語や数式などが理解できないために、その価値を感じられる前につまづいてしまうことも少なくありません。

そこで今回は、非常に「ざっくり」と、基本的な概念と分析の進め方を図解で説明します。

図解で分かる重回帰分析【前編】〜「ざっくり」と理解する〜

分析の手順

手順① 成果を選ぶ

まず初めに、今回の分析によって知りたいことを成果(目的変数)として決めます。実務的には、何らかの施策を通じて「増やしたい」(もしくは減らしたい)ことを持ってきます。なお、先ほどのレストランの例では、「来店客数」を上げましたが、これ以外にも「総売上」「一人当たり売上」「料理注文数」「予約数」など、どのような分析したいかによって、いろいろなことを当てはめることができます。

図解で分かる重回帰分析【前編】〜「ざっくり」と理解する〜

手順② 要素の候補をリストアップする

続いて、成果に関係がありそうな項目を要素の候補としてリストアップしていきます。もし、初めから影響していそうな要素にアテがあれば、それほど多くを洗い出す必要はありません。逆に、あまり明確なアテがない場合は、幅広く候補を出しておき、分析をしながら絞り込んでいく方が良い分析結果を得られることが多いです。

ただし、データを準備するには手間と時間がかかりますので、どこまでの労力を掛けられるかによって集められるデータの範囲も変わります。

図解で分かる重回帰分析【前編】〜「ざっくり」と理解する〜

手順③ 要素の候補の最適な組み合わせを作る

最後に、ピックアップした要素の候補を取捨選択しながら、ひとつのモデル(成果を説明する要素の組み合わせ)を作っていきます。作成したモデルを評価する指標として「決定係数」「t値」「p値」などがあげられます。この詳細については重回帰分析を理解するために知っておきたい7つの統計用語を参照してください。

図解で分かる重回帰分析【前編】〜「ざっくり」と理解する〜

そのモデルは「正しいのか?」

ただし、作成したすべてのモデルが現実を表しているとは限りません。モデルはあくまでも「数学的な組み合わせ」でしかなく、どのような組み合わせも計算が出来るからです。

たとえば、レストランの集客数が「お店の公式Facebookページに記事を投稿した日は来客数が増える」という関係があったとします。これが本当ならば、Facebookの投稿は積極的に行うことで、来客数を増やすことができるはずです。

そこで、Facebookの投稿を積極的に増やし、毎日投稿をするように変えてみました。1ヶ月間、毎日投稿をしてみましたが…結果的に来客数は全く変わりませんでした。改めて調べてみると、当初は「Facebookには金曜日のお昼に記事を投稿する」というルールで運用していたことが分かりました。

つまり、「Facebookの投稿がお客さんを増やした」のではなく、「金曜日だから増えていた」のであり、たまたまその日にFacebookを投稿していただけでした。

では、どういう失敗が起こりやすいのか?

ここまで分かりやすい関係であれば初めから気付くことができたかもしれませんが、多くの場合、もっとさまざまな要素が絡み合っており、今回のような「見せ掛けの相関」に気付くことさえ難しいのが実情です。

そこで次回は、重回帰分析を実際に活用する中で、重回帰分析で陥りがちな10の失敗パターンについて取り上げてみたいと思います。

この記事を書いた人