回帰分析による売上予測の手順:変数の選び方・Excelでの実施・結果の読み方

売上予測の手法には、過去実績のトレンド延長・営業パイプラインの積み上げ・統計モデルの活用など、いくつかのアプローチがあります。その中でも「回帰分析」は、広告費・季節性・価格といった複数の要因が売上にどう影響しているかを数値で明らかにし、より精度の高い予測を可能にする統計手法です。
売上予測の手法全般については「売上予測とは?目的別の手法・ツール・精度を高めるポイントを徹底解説」で解説しています。本記事では、そのうち統計的アプローチである回帰分析に絞り、変数の選び方・Excelでの実施方法・結果の読み方まで、実務で使える手順を詳しく説明します。
目次
売上予測に回帰分析を使う理由
過去実績を単純に延長するトレンド予測は、「環境が変わらない」という前提に立っています。しかし実際の売上は、広告出稿の増減・競合の動き・季節変動・価格変更など、複数の要因が同時に作用した結果です。こうした複数の要因を切り分けて評価し、「来期この施策を強化したら売上はどう変わるか」を事前にシミュレーションできるのが、回帰分析の最大の強みです。
一言で表すなら、トレンド予測は「過去の延長を見る手法」であり、回帰分析は「何が売上を動かしているかを理解した上で予測する手法」です。
回帰分析の種類と売上予測での使い分け
回帰分析には複数の種類がありますが、売上予測では主に以下の3つが使われます。
単回帰分析は、説明変数(要因)が1つだけの場合に用います。「広告費と売上の関係だけを見たい」といった単純な分析に向いていますが、現実の売上は複数の要因で動くため、実務での使用場面は限られます。
重回帰分析は、説明変数を複数設定できるため、売上予測で最もよく使われる手法です。広告費・価格・季節性・競合動向など、複数の要因が売上に与える影響を同時に数値化できます。本記事では、この重回帰分析を中心に手順を解説します。
ロジスティック回帰分析は、目的変数が「購入した/しない」「解約した/しない」など2値のデータである場合に使います。売上金額の予測よりも、顧客行動の確率予測に向いた手法です。
回帰分析による売上予測の手順

回帰分析による売上予測は、大きく3つのステップで進めます。
STEP1:目的変数と説明変数を定義し、データを収集する
まず「何を予測したいか(目的変数)」と「何が影響しているか(説明変数)」を明確にします。売上予測における目的変数は、月次売上高・来店客数・受注件数など、予測したい指標を1つ選びます。
説明変数の選定は、分析の精度を左右する最重要ステップです。売上予測でよく使われる説明変数の例を以下に挙げます。
マーケティング施策関連
- 媒体別の広告出稿量・広告費(テレビ・Web・SNSなど)
- キャンペーンの実施有無(0/1のダミー変数)
- 割引率・クーポン発行数
市場・外部環境関連
- 季節性指数(月ごとのダミー変数、または業界の季節指数)
- 競合の広告出稿量・価格変動
- 景気指数・消費者物価指数
- 天候データ(気温・降水量)
自社内部要因
- 商品価格・値引き率
- 営業人員数・営業日数
- 新規顧客数・既存顧客のリピート率
データは週次または月次の時系列形式で揃えるのが基本です。少なくとも1〜2年分のデータがあると、季節変動を適切にモデルに反映できます。変数の選定については重回帰分析の注意点のセクションもあわせてご確認ください。
STEP2:回帰分析を実施する
データが揃ったら、分析ツールを使って回帰分析を行います。
Excelで実施する場合
Excelの「データ分析」機能(分析ツールパック)を使うことで、専用ソフトがなくても重回帰分析を実施できます。手順は以下の通りです。
- Excelのメニューから「ファイル」→「オプション」→「アドイン」→「分析ツール」を有効化する
- 「データ」タブに「データ分析」が表示されたらクリックし、「回帰分析」を選択
- 「入力Y範囲」に目的変数(売上データ)、「入力X範囲」に説明変数(複数列)を指定して実行
出力結果として、係数・決定係数・p値などが含まれた分析レポートが生成されます。
専門ソフト・言語を使う場合
より高度な分析や大量のデータを扱う場合は、RやPythonなどの統計解析言語、またはSPSS・SASなどの専門ソフトを使います。これらはExcelより柔軟な分析が可能ですが、一定のプログラミング知識が前提となります。
実際のExcelを使った重回帰分析の詳細な手順については、無料資料「Excelでできる重回帰分析ガイド」をご活用ください。
STEP3:分析結果を読み解き、予測モデルを検証する
回帰分析の出力をそのまま使うのではなく、結果の妥当性を確認することが精度向上の鍵です。主に以下の3つの指標を確認します。
決定係数(R²):モデルの当てはまりの良さ
R²は0〜1の値を取り、1に近いほど説明変数が目的変数の変動をよく説明できていることを示します。売上予測では一般的にR²が0.7以上あれば実用的なモデルと判断できますが、業種や分析の複雑さによって基準は異なります。ただしR²が高すぎる場合(0.99など)は、過学習(データに過度に適合しすぎている状態)の疑いがあるため注意が必要です。
係数(Coefficient):各要因の影響度
各説明変数の係数は「その変数が1単位増えたとき、売上がどれだけ変化するか」を示します。例えば「広告費の係数が3.2」であれば、広告費を100万円増やすと売上が320万円増加すると解釈できます(他の変数が一定の場合)。係数の符号(プラス・マイナス)も重要で、予想と逆の符号が出た場合は変数の設定や期間に問題がある可能性があります。
p値:統計的な有意性の確認
p値は、その係数が「偶然の誤差ではなく、本当に意味のある関係を示しているか」の指標です。一般的にp値が0.05未満であれば、その説明変数は統計的に有意だと判断します。p値が高い変数(0.1以上など)は、モデルへの貢献が小さい可能性があるため、削除または別の変数への置き換えを検討します。
これらの指標を確認しながら、説明変数の追加・削除・変換を繰り返し、納得のいく予測モデルを構築していきます。
回帰分析による売上予測の注意点
説明変数の選び方:多重共線性と変数の絞り方
説明変数は多ければ良いというわけではありません。変数同士の相関が高い変数を同時に投入すると「多重共線性」という問題が生じ、係数の推定が不安定になります。例えば「テレビCM出稿量」と「ブランド認知率」は互いに強く相関するため、同時に投入すると両方の係数が不安定になるケースがあります。
また、データ数に対して説明変数が多すぎると過学習が起きやすくなります。目安として、説明変数の数はデータ件数の10分の1以下に抑えるのが一般的です。
変数の絞り込みには、VIF(分散拡大因子)による多重共線性の診断や、ステップワイズ法(変数を1つずつ追加・削除しながら最適な組み合わせを探す手法)が有効です。
重回帰分析でよくある失敗パターンについては、「重回帰分析でよくある失敗10パターン」も参考にしてください。
回帰分析の限界:因果関係との混同と非線形関係への対応
回帰分析はあくまで「相関関係をモデル化する手法」であり、因果関係を証明するものではありません。「広告費と売上に強い相関がある」という結果は、「広告費が売上を増やした」とは限らず、「売上が伸びている時期に広告費も増えやすい」という逆の関係や、第三の変数(季節性など)が両者に影響している可能性もあります。
また、回帰分析は変数間の関係が線形(比例的)であることを前提としています。売上が広告費に対して一定水準を超えると効果が逓減するような非線形の関係がある場合、単純な回帰分析では精度が出にくくなります。こうした場合は変数の変換(対数変換など)や、より高度な統計モデルの活用を検討します。
まとめ
回帰分析を使った売上予測は、「何が売上を動かしているか」を数値で把握した上で将来を見通せる点が、トレンド延長や感覚的な見積もりとの大きな違いです。
実務で取り組む際の基本的な流れは以下の通りです。
- 予測したい目的変数と、影響を与えると考えられる説明変数を定義する
- 週次・月次の時系列データを1〜2年分以上収集・整備する
- ExcelまたはRやPythonなどのツールで回帰分析を実施する
- R²・係数・p値を確認し、モデルの妥当性を検証する
- 変数の追加・削除・変換を繰り返し、精度を高める
始めはシンプルな重回帰分析から試し、モデルの挙動に慣れながら精度を積み上げていくアプローチが現実的です。社内に統計の知見が不足している場合も、まずExcelの分析ツールパックで試してみることをお勧めします。
回帰分析をさらに発展させ、テレビCM・Web広告・SNS施策など複数チャネルの売上貢献を統合的に分析・シミュレーションしたい場合は、MMMの活用が有効です。サイカのMMM分析基盤「MAGELLAN(マゼラン)」は、こうした複合的な売上予測と予算最適化を支援します。
回帰分析の基礎から関連する統計知識をさらに学びたい方は、以下の記事もあわせてご活用ください。





