【ゼロから始めるデータ分析#3】データ分析の現場から他部署と経営陣を巻き込む4つのTips

これまでデータ分析を学んだことがない方に向けて、データ分析の基礎を解説していく本連載。「データ分析の8ステップ」「覚えておくべき3つの分析手法」「他部署と経営陣を巻き込む4つのTips」の3本立てでお送りしています。

第1回では、データ分析の基本となる8ステップを解説し、第2回では、ビジネスパーソンが覚えておいて損はない3つの分析手法をご紹介してきました。 

これまでの記事でもお伝えしてきたとおり、データ分析は分析をして終わりではありません。分析結果にもとづくアクションを起こし成果につなげてこそ、データは活用できているといえます。

アクションを起こす上で大事なのが、経営陣や他部署など、組織の巻き込みです。

しかし、データ分析を担当するビジネスパーソンが、分析の現場から経営陣や他部署を巻き込んでいくためのポイントはなかなかまとまっていません。

最終回となる今回は、データ分析の8ステップのうち、Step7「巻き込み」で役に立つ4つのTipsをご紹介していきます。

データ分析の8ステップ

Tips1:ビジョンと成果で語れ

経営陣や他部署のメンバーの関心事は何でしょうか。

それは「高度な分析ができるか否か」ではなく、「成果につながるか否か」です。

データを扱う方々は、データを成果に、そしてその先のビジョンに接続する役割を担います

「自分たちはどんな世界を実現したいのか」というビジョンから逆算して、「このデータはビジョン達成のためにどんな成果をもたらすか」を語ることが、経営陣や他部署を巻き込む1つ目のポイントです。 

データ分析は、意識していても目的から外れていきやすいものです。分析に必要なデータが集まらなかったり、予想していたものとは異なる分析結果が出たりして、いつのまにかビジョンや目的を見失い頓挫してしまった、という話はよく聞きます。 

このように、「分析をすること」自体が目的化して失敗に陥る事態を防ぐためにも、データをビジョンと成果で語り、組織に横串を通していくことが重要です。

Tips2:まず成功体験を作れ

組織を巻き込む一番の近道は、「データにもとづいてアクションをしたら成果が生まれた」という成功体験をしてもらうことです。

なので、まずは小さな成功を生み出せるプロジェクトで成果を作り、組織に成功体験をもたらすことを目指しましょう。これが2つ目のポイントです。

データ分析は、必ずしも巨額のコストがかかるものではありません。収集や分析にコストがかからないデータでも、小さな成功を収めるには十分なケースが多いです。

小さな成功を重ね、データ分析の効果を組織全体が実感できるようになると、しだいに組織内でデータの重要性が高まってきます。データにもとづき意思決定をするデータドリブンな組織風土の醸成は、こうした小さな一歩からはじまります。

データドリブンな組織文化ができれば、データを事業成果につなげることが当たり前になるでしょう。

Tips3:視覚に訴えろ

データ分析の結果をまとめたレポートには、見慣れない数式や複雑なグラフ……そのまま見せても「なんか難しそう」と思われ、拒否反応を示されてしまうケースも。

こんなときはビジュアルを活用しましょう。データになじみがない人でも分かるよう、誰でも一目で分かるように見せる工夫ができます。 

一つ、簡単な例を見てみましょう。下の図の左側にある2つのグラフは、それぞれ「テレビCMの出稿量」「バナー広告のインプレッション数」を表したものです。これらを見て相関関係を見出せと言われても、なかなか難しいのではないでしょうか。

では、右側のグラフを見てみましょう。こちらは、「テレビCMの出稿量」「バナー広告のインプレッション数」「コンバージョン数」を表す3つのグラフを重ねたものです。波形を比べてみると、バナー広告よりもテレビCMのほうがコンバージョンと連動していることが一目で分かります。 

このように、いくつかのグラフはバラバラに見せるのではなく、波形と波形を重ね合わせて見せることで、分析に詳しくない方にも分かりやすく伝えることができます。これが3つ目のポイントです。 

グラフを重ねることで、伝えたいことをわかりやすく見せる例

Tips4:データで工夫せよ

分析の前提には「データ収集」があります。ですが、これからデータ分析を始めようというタイミングで必要なデータが完璧に揃っていることはなかなかありません。また、データ収集の段階で組織の協力は必要不可欠ですが、まだ成果が出ていない段階でデータ収集に協力を仰ぐことが難しい場合もあるのではないでしょうか。

そんな時は、Tips2に挙げた小さな成功を目指し、「今あるデータ」を工夫して使い、分析を行う努力も必要です。

ほしいデータが集まらないときや、必要なサンプル数に満たないとき──そんなときは、代わりになるデータがないか、少ない数でも分析できないかを考えてみましょう。 

「このデータじゃないとだめ」「●●サンプル以上ないとだめ」と思っていたけれど、実は別のデータでも、数が少なくても、大きな誤差なく分析できる場合があります。完璧なデータが揃っていなくてもデータ分析はできるのです。 

(e.g)ほしいデータが集まらないときに、別のデータを使う例

「ある地域の、日別の人の移動推移」を示すデータがほしい場合、GPSデータを集めて測定したり、実際に現地に人を派遣して測定したりする方法が考えられます。しかしこれらの方法を使うには大きなコストがかかります。

この場合、検索ボリュームとその推移をチェックする無料ツール「グーグルトレンド」のデータで代用できます。検索ボリュームから、おおよその日別の人口推移を推計できるからです(*1)。こうすれば簡単に必要なデータを集められ、大幅なコスト削減になるでしょう。

(*1)訪問先からの移動手段や経路、時間などを検索する人が多いだろうという仮定にもとづき、グーグルトレンドのトップページで「〇〇(地域名)から」と入力して検索する。

例えば下のグラフは、「渋谷駅から」と検索した結果。2020年1月15日に国内で最初のCOVID-19感染者が確認された後、東京都内で大きな流行がみられた2020年3月下旬〜5月下旬、特に、1回目の緊急事態宣言が発出された2020年4月7日〜5月25日の期間は、検索数が大きく減少する一方、緊急事態宣言と重点措置が全面解除された2021年9月頃からは検索数の上昇がみられる。このことから、検索ボリュームと人口流入数に相関があることが確認でき、人口流入数を推計できる。

グーグルトレンドを活用し、検索ボリュームからおおよその人口流入を推計する例

Point)代替データを使うとき/少ないサンプル数で分析するときの注意点

どんなデータでも無条件に代替できるわけではありません。代替データを使うときや、少ないサンプル数で分析する際は、事前に以下を確認するようにします。

◆ 代替データを使うとき

ほしいデータと代替データのあいだに相関があることの確認(上に挙げた例を参照)
・代替データに異常値がないかの確認

◆ 少ないサンプル数で分析するとき

・必要サンプル数と実際に集められるサンプル数の間で、どのくらい精度に違いがあるかを示す「標準誤差」という数値の確認
※ 標準誤差の数値が小さければ精度が高く、大きければ精度が低いということになります。標準誤差はエクセルの数式を使って算出することができますが、少し専門的な話になるので、詳細は別の機会にご説明したいと思います。

おわりに  

3回にわたり、データ分析の基礎知識をご紹介してきました。

3回とおしてお伝えしてきたのは、データ分析は事業成果につなげてこそ意味があるということ。そして、データ分析は、基本をおさえれば誰もが取り組めるものだということです。

「データ分析は専門家でないとできない」「完璧なデータがないとできない」と思っている方がいるかもしれませんが、実はそんなことはありません。できるところからぜひ実践していただきたいと思います。 

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」
【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

データ分析をゼロから学びたい人におすすめの書籍2選 

木田浩理・伊藤豪・高階勇人・山田紘史(2020)『データ分析人材になる。目指すは「ビジネストランスレーター」』日経BP 
三井住友海上でDXを推進するデータサイエンティストの方々による著書。企業でデータ分析を担当する人が押さえておくべき重要な考え方が「5Dフレームワーク」という方法論で解説されています。ビジネスの現場に寄り添って書かれているので、データ分析担当者だけでなく、マネジメント層や経営層にもおすすめしたい一冊です。 

河本薫(2017)『最強のデータ分析組織 なぜ大阪ガスは成功したのか』日経BP 
「データサイエンティスト・オブ・ザ・イヤー」の初代受賞者である、大阪ガスの河本薫氏が、データ分析組織の立ち上げから今日に至るまで、どのように壁を乗り越えてきたかを紹介しています。組織の作り方や巻き込みについてヒントがもらえるはずです。 

※Amazon商品ページのリンクを掲載しています

株式会社サイカ
ADVA Analysis部部長 西 津平

九州大学大学院工学府修了。大学院時代、原子力発電に関わる実験を通してデータ分析と統計学を学び、新卒から3年間、遊技機メーカーにて市場動向のデータ分析業務に従事。業界にとらわれずもっと広い範囲でデータ分析ができる環境を求め、2018年10月、サイカ入社。現在ADVA Analysis部の部長を務める。

【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

「データ分析の8ステップ」「覚えておくべき3つの分析手法」「組織の巻き込み方」の3本立てで、これまでデータ分析を学んだことがない方に向けて、データ分析の基礎知識を解説していく本連載。

第1回では、データ分析の8ステップを解説しました。
【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

分析の8ステップ

第2回となる今回は、このうちの「Step5:分析」に焦点をあて、ビジネスパーソンが覚えておいて損はない3つの分析手法を紹介します。

分析の8ステップ「Step5:分析」

ビジネスで使える、3つの分析手法

ビジネスパーソンがなぜデータ分析をするのか? と聞くと、
「売上に響いている要因を特定したい」
「投資の効果を定量化したい」
といった思いが背景にあることがほとんどだと思います。

これらはいずれも、売上とそれぞれの要因、 投資額とその効果というように「データとデータの結びつきの強さを数値化・可視化したい」という要望であると言い換えられます。

データ分析(統計分析)は、このようにデータとデータの結びつきの強さから影響度合いを数値化・可視化することを得意とします。

データ分析の手法は数多くありますが、今回は、ビジネスパーソンが覚えておいて損はない、比較的簡単な「クロス集計」「単回帰分析」「重回帰分析」の3つの分析手法について紹介していきます。

データ分析の基本「クロス集計」


仮説に合わせて、さまざまな切り口でデータを掛け合わせて分析する手法が「クロス集計」です。

クロス集計は、特別な統計知識も、難しい数式も、特殊な解析ソフトも必要なく、初心者の方でも明日から取り組んでいただける分析手法です。しかし、その分かりやすさとは裏腹に、データ分析の領域で「クロス集計を制する者がデータ分析を制す」という言葉があるほど重要な、データ分析の基本となる分析手法です。

(e.g.)アイスメーカーが女性向けキャンペーンの実施を決定。キャンペーンの対象商品を決めるためにデータ分析を試みた

キャンペーンの対象商品として候補に挙がっているバニラアイスとストロベリーアイスの売上データを比較してみると、バニラアイスがストロベリーアイスの2倍の売上を占めています。このデータだけを見たら、バニラアイスをキャンペーンの対象商品にしようと思うかもしれません。

商品ごとの売上データ

ですが、今回はターゲットを女性にしぼったキャンペーンです。そこで、性別ごとの売上データを見てみると、女性よりも男性のほうが購買数が多いことが分かります。

購入者の性別ごとの売上データ

そこで、購入者の性別ごとに売上データを見てみましょう。すると、バニラアイスの購入者の9割は男性で、一方のストロベリーアイスは、購入者の8割が女性でした。この結果を受け、 今回の女性向けキャンペーンの対象商品はストロベリーアイスに決定しました。

購入者の性別と商品の売上をかけ合わせてクロス集計

クロス集計はこのように、データをタグ(性別・年齢・嗜好など)で分類し、それらを掛け合わせて行う分析です。

1対1の関係性の強さを導き出す「単回帰分析」

 
“身長”と“体重”、 “最寄り駅からの距離”と“賃貸住宅の家賃”のように、仮説の時点で関係性が強いと予想される2つのデータの関係性の強さを導き出す分析手法が「単回帰分析」です。

一般的には、単回帰分析を行う前に、データとデータの相関の強さを表す「相関係数」を算出し、相関関係の有無を確認するところから始めます。相関係数はエクセルの標準数式を使って算出することができ、−1(完全な負の相関)から+1(完全な正の相関)の間の数値になります。

相関関係の有無を説明した図

相関関係の有無は、相関係数の数値によって以下のように判断します。

相関係数の判断基準

2つのデータの相関関係は、比例もしくは反比例の関係にあるので、分析のアウトプットとしては、「一方が大きくなるともう一方も大きくなる」「一方が大きくなると他方が小さくなる」「相関なし」のいずれかになります。

「相関」というのは単なる関係性の有無なので、2つのデータの間に原因→結果があるかないかは関係ありません。一方の「単回帰分析」は、片方のデータが1増えるともう片方のデータがどのくらい増えるかといった、2つのデータの原因と結果の関係を求めるものです。

2つのデータの相関の規則性を視覚的に確認するためには、「散布図」というグラフを使います。データが該当するところにプロット(打点)していき、これらの点の傾向を表す傾向線を引くと、線の傾きの大きさで、2つのデータの関係(xが1増えると、yはどのくらい増えるか)を可視化できます。

散布図のイメージ

また、2つのデータの関係を数値化したものを「回帰係数」といいます。

単回帰分析を説明する図

Point)単回帰分析は、売上予測には向かない

ビジネスの現場で、1つの要因と1つの成果のみが存在する状況はほとんどありません。たとえば、テレビCMがどのくらい売上に影響を与えたかを知りたいときに、テレビCMの出稿量と売上高のデータを使って単回帰分析をしても、精度の高い予測は見込めません。実際は、新聞広告やインターネット広告など、ほかの広告施策、立地や天候、値下げセールなど、さまざまな条件が売上に影響を与えているからです。売上予測には、次項で紹介する重回帰分析を使うことをおすすめします。

複数の要素の関係性を見出す「重回帰分析」


「重回帰分析」は「単回帰分析」と同じく、成果と要因の関係性を導き出す「回帰分析」の仲間です。単回帰分析が2つのデータの相関関係を探るのに対し、重回帰分析は3つ以上データの相関関係を導き出します

ビジネスの現場では、
「売上目標を達成するためには、広告宣伝費にいくらかけるべきか」
「施策Aと施策B、それぞれどのくらいの効果が見込めるか」
「今期の予算をどう配分すると、マーケティング成果を最大化できるか」
というように、複数の要因を統合的に分析した上でアクションを検討すべき場面が多くあります。

重回帰分析は、こういった売上予測やマーケティング戦略の策定などに活用できる、マーケティング分野では必須ともいえる分析手法。 成果に影響を与えていると予想される3つ以上の要因(=説明変数)を、成果(=目的変数)に掛け合わせ、それぞれの相関関係のあり・なし、関係性の強さ・弱さを導き出す分析です。

重回帰分析を説明する図

※ 標準化と標準化偏回帰係数:成果に影響を与えている要因(説明変数)は、それぞれ単位が違います。そこで、それぞれの変数を特定の値になるように調整します。このことを「標準化」といい、標準化によって求められる「標準化偏回帰係数」は、平均を0、分散を1で表し、数値間の大小で相対的に各変数の影響度合いを評価します。

(e.g.)マーケティング施策の最適な予算配分を検討するため、重回帰分析を行う

① 今回の分析で知りたいこと(何らかの施策を通じて増やしたい、もしくは減らしたいこと)を成果(目的変数)として設定します
例)最適な予算配分でマーケティング施策を実行し売上を上げたい場合は、「売上」を目的変数におきます

② 最終的な成果(目的変数)に影響を与えていそうな複数の要因(説明変数)を洗い出します(説明変数は10以内におさめます)

③ それぞれのデータを収集し、統計ソフトで分析します
※ エクセルのデータタブにある「回帰分析」ツールや、「JMP」や「SPSS」などの有料ソフトを使います

④ 算出された方程式(重回帰式といいます)に、計画している施策の予算を入れ、各施策の最適な予算を探ります

Point)重回帰分析は、説明変数同士で相関関係が強いものを入れてしまうとうまくいかない(多重共線性)

重回帰分析を行う際、分析精度を上げようと、たくさんの説明変数を入れてしまうことがあります。ですが、説明変数同士で相関関係の強いものがあると「多重共線性」という現象が起き、予測精度が低下します。多重共線性は、英語で「multicollinearity」ということから、略して「マルチコ」とも呼ばれます。

(e.g.)「コンビニの月間売上(成果)」に関係がありそうな要因として「月間の降水量」と「雨が降った日数」を説明変数に入れて重回帰分析を行った
→「月間の降水量」と「雨が降った日数」の相関関係が非常に高いため(雨が降った日数が多ければ月間降水量も増える)、多重共線性が発生する

<多重共線性が発生してしまった場合の回避方法 >

①相関関係が強い要因のうち、どちらか一方を外して再度分析する(どちらを外すか迷った場合は、仮説に沿って優先度の高い方を残す。または両方を一つずつ入れて分析してみる)
②変数同士の性質が同じ場合(たとえば、動画Aと動画Bを変数として入れたい場合など)は、両者を統合(足し算)した数値を使って分析する

まとめ

データ分析の代表的な手法を3つ紹介してきました。これらの手法を正しく活用するためには、どのような仮説を立てるかが重要です。本連載の第1回でデータ分析の一連の流れと仮説の立て方を解説しているので、そちらもぜひご覧ください。

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

データ分析をゼロから学びたい人におすすめの書籍2選

『やさしく学ぶ データ分析に必要な統計の教科書』羽山 博(著)
エクセルを活用した分析のやり方など、実践的なHOWTOを学べます。はじめてデータ分析に触れる方が、データ分析の基礎を学びたいと思ったときにおすすめの一冊です。

『統計学図鑑』栗原 伸一 ・丸山 敦史 (著)
教科書に載っているようなデータ分析手法を、噛み砕いて説明してくれています。図鑑という名のとおり絵や図が多いので、初心者でも理解しやすくなっています。分析手法の名前から逆引きもできるので、それぞれのデータ分析手法について詳しく学びたいときにもおすすめ。辞書のように手元に置いておきたい一冊です。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ
ADVA Analysis部部長 西 津平

九州大学大学院工学府修了。大学院時代、原子力発電に関わる実験を通してデータ分析と統計学を学び、新卒から3年間、遊技機メーカーにて市場動向のデータ分析業務に従事。業界にとらわれずもっと広い範囲でデータ分析ができる環境を求め、2018年10月、サイカ入社。現在ADVA Analysis部の部長を務める。

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

ビジネスにおいてデータ分析の重要性が増していることは周知の事実です。データドリブンな経営を志向し、すでに動き出している企業や組織も多いのではないでしょうか。

しかし、
「データ分析とは何なのか、実はよく分からない」
「貯まっているデータはあるが、目の前の課題との繋げ方が分からず活用できない」
「データ活用を意識しているつもりだが、思ったような成果が出せていない」
「自分は文系で、統計学や数学、プログラミングに詳しくないからデータ分析はできない」

と動き出せずにいるビジネスパーソンがいることも想像に難くありません。

ですが実際のところ、ビジネスでのデータ活用は、専門知識がなくてもできることが多いのです。

この連載は、「データ分析の8ステップ」「覚えておくべき3つの分析手法」「組織の巻き込み方」の3本立てになっています。

これまでデータ分析を学んだことがない方に向けて、ビジネスにおけるデータ分析の必要性と覚えておくべきデータ分析の基本をポイントを絞って解説し、データをビジネスの成果に繋げるヒントを紹介していきます。

ビジネスにデータ分析が必要な理由

自動車を運転するときのことを考えてみてください。運転中、運転席前のメーターパネルに表示される速度計やガソリン残量、カーナビなどを確認しながら運転する方がほとんどではないでしょうか。

メーターがなくても車は走るし、目的地に到達することもできます。ですが、「メーターがない車を買いますか?」と聞かれたら、99.9パーセントの人はきっと買わないと答えるでしょう。

それはメーターが、「この速度でこのカーブを曲がり切れるか」「目的地までオイル補給なしで到達できるか」といったことを教えてくれるからです。また、カーナビが現在地や周辺情報を教えてくれるからこそ、いつも走ったことのない道を走る楽しみを味わうこともできるし、知らなかった抜け道を発見することもできます。

車のメーターは、目的地まで効率よく安全に行ける確度を高め、新しい道を教えてくれる、自動車にとって非常に重要な装置なのです。

データ分析を自動車のメーターに当てはめて考えると、なぜビジネスにデータが必要なのかがよく分かります。データを使わないビジネスは、メーターやカーナビのない自動車を運転しているようなものなのです。

ビジネスにデータ分析を取り入れることで得られるメリットは、大きく2つあります。

一つは、「勝率を高めること」
車のメーターが安全な速度や必要なオイル量を教えてくれるように、データを使うと勝率の高い戦略を導き出すことができます。成果に対して、どの要素がどのくらい影響を与えているのかを方程式化できるからです。成果と要素の関係性を可視化・数値化すると、成功に再現性がもたらされます。

データ分析を取り入れることで得られるもう一つの効果は、「これまで見落としていた欠点を浮き彫りにしたり、思いもよらなかった伸び代を顕在化させたりすること」です。意外にも、データはクリエイティブの源泉なのです。

データは、貯めれば貯めるほど強化されますより学習できるようになり、精度が上がるからです。データの蓄積を始めるのが早ければ早いほど、ビジネスの勝率を高めることができます。

デジタル化がますます進む時代、これまで以上に“データに基づいた判断”が必要になってくるでしょう。

「データを活用する」とは

具体的なデータ活用のフローを解説する前に、「データ」「データ分析」「データ活用」がそれぞれ何を意味しているかについても整理しておきたいと思います。

データとは


「データ」をあえて定義づけるなら、“世の中の事象を定量化したもの”といえるでしょう。つまり、どんなものでも定量化できればデータになるのです。

データとは何かと聞かれたとき、「2021年8月1日はのり弁当が20個売れた」という購買データや、「2021年7月の平均気温は25.9度であった」という気象データなどを想像する人が多いのではないでしょうか。

データは大きく「量的データ(量的変数)」「質的データ(質的変数)」に分類できます。

量的データは、例に挙げたような個数や気温、件数、頻度、身長・体重など、単位のつく数値で表せるもの。一方の質的データは、性別や血液型、好きな芸能人や好き嫌いなど、カテゴリーを区別するものをいい、数値ではなく「あり・なし」や「A・B・O・A B」などの文字で表されます。

量的データと質的データ

技術の進歩により、質的データでも定量化する工夫ができるようになってきました。これからは、データ分析で扱えるデータの種類がますます増えていくことが予想されます。

データ分析とは


“データから情報を取り出すこと”をデータ分析といい、データ分析には「記述統計」「推測統計」という2種類の手法があります。

記述統計は、集めたデータを図表やグラフにし、”データを見やすくして特徴を探る”分析の手法です。

たとえば、学年ごとの平均身長と平均体重を記録した数値データ。これらを棒グラフや折れ線グラフにすると、学年ごとの平均身長の差異や、身長と体重の関係性が見えやすくなります。このように、データを見やすく加工して、収集したデータの性質を把握する取り組みが記述統計です。

一方の推測統計は、一部のサンプル(統計学では「標本」という)から全体の傾向を捉え、”データを見てもわからない情報を取り出す”分析の手法です。

たとえば選挙速報。「開票率1%で当選確実」というニュースを見て、なぜ分かるのだろうと不思議に思ったことはないでしょうか。統計分析はよく味噌汁に例えられます。鍋いっぱいに入っている味噌汁のうち、お玉ですくったひとすくいも同じ味噌汁です。選挙速報では、開票した表の一部をサンプルとして全体の傾向を探り、当選・落選を判断しています。このようにサンプルを取って全体を把握しようという取り組みが推測統計です。

全国で投票された選挙票をすべて開票するのが難しいように、すべてのデータを集めるのが困難なケースも多くあると思います。そのようなときにはこの推測統計を使います。

データ活用とは


データ分析によって、「身長と体重の増加は比例している」といった情報や、「男子は小学6年生から中学1年生の間の身長の伸びがもっとも大きい」など、何らかの情報が抽出されます。

 “抽出された情報を目的に合わせて解釈し、適用する”のが「データ活用」です。

たとえば、「20:00以降にごはんを食べると太る」という分析結果(情報)があったとします。

この情報を、「スポーツのために体重を●●kg増やしたい」という目的を達成するために活用するのであれば、「夜ごはんの量をこれまでより●●パーセント増やそう」となります。けれどももし、「体重を適正体重まで落としてダイエットに成功したい」が目的であれば、「夜ごはんは●●時までに食べ終わっていたほうがよい」となるでしょう。

このように、目的が変われば分析結果の解釈とアクションは大きく変わります。ビジネスでデータを活用する際も、目的の設定は非常に重要です。

データ分析の8ステップ

ここからは、ビジネスにおけるデータ活用のフローを、8つのステップに分けて紹介していきます。

ビジネスでデータを活用するときにもっとも重要なのが、以下のフローに沿って進めることです。頭から順に進めていき、「おかしい」と思ったら前に戻る。このフローに従わずに進めると、そのデータ分析は失敗に終わる可能性が高くなってしまいます。

データ分析の8ステップ

Step1:目的(達成したいことを明確にする)


先述のとおり、目的によって解釈やアクションは大きく変わります。なので、まずは“なぜデータ分析をするのか”という目的を明確にすることが重要。
「売上を最大化したい」「新規事業を成功させたい」など、会社としての大きな目標を自分ごと化し、データを活用して達成したい目的にまで落とし込む作業が、データ分析の最初のステップです。

Point)当たり前。でも重要な“目的意識”

一見当たり前に思われるかもしれませんが、目的があいまいなまま分析をした結果、多大な労力と費用をかけて分析をしたのに有益な示唆が得られずに終わるケースが多くあります。組織で分析・意思決定・巻き込み・実践への落とし込みを実現するためには、強い目的意識を持つことが重要です。

Step2:課題(解決したい課題を特定する)


データ分析の目的が明確になったら、目的を達成するために解決すべき課題を特定します。課題を特定するためのアプローチは2つあります。

1. 何が課題か想定できる場合:実データから特定する

(e.g.)目的が「売上を最大化したい」の場合:
① 売上を構成する要素を分解

売上を要素分解した図

② 要素をシンプルなグラフにし、成果やコストを比較

既存売上と新規売上を比較した折れ線グラフ
コンバージョン数と流入数を比較した折れ線グラフ

③ 課題を特定

ディスプレイ広告とリスティング広告の効果を比較した折れ線グラフ

2. 過去のデータがなく、何が課題か想定できない場合(新規事業を創出する場合など):未来の仮説(こうなるのではないか)をつくり、想定される未来の課題を洗い出す

(e.g.)目的が「売上を最大化したい」の場合:
① 未来の仮説を立てる
② 仮説に近い過去のデータを参考に、因果関係を推測する
③ 課題を特定する

未来の仮説(達成したいビジョン)から課題を特定する手順を説明した図

Point)課題は、2つのアプローチのいずれかを使って特定する

これらのアプローチを使わずに課題を特定しようとすると、妄想で課題を設定することになります。そうすると、課題を達成しても目的が達成されないという落とし穴にハマってしまうので注意が必要です。

Step3:仮説(課題を引き起こす要因を推測する)


課題が明確になったら、その課題を引き起こしている要因を推測します。「Step2:課題の特定」と同じように、ここでも要素の洗い出しと構造化からスタートします。

(e.g.)「リスティング広告の流入数が少ない」が課題の場合:
①「リスティング広告の流入数」を構成する要素を洗い出す
②洗い出した要素を構造化する

「リスティング広告の流入数」を構成する要素を洗い出した図

Point)構造化したら、「因果関係は正しいか」「MECEになっているか」の2点を確認する

構造化する中で、因果関係の間違いや要素の抜け漏れ・重複があると、精度の高い仮説が立てられません。構造化したら、以下の4点を確認しましょう。

● KPIと要因(施策)が同じステップで扱われていないか
● 課題とKPI/KPIと要因が逆になっていないか
● 課題を説明する要素に漏れがないか
● 要素に重複はないか

③ 課題を引き起こす要因を推測する

Point)仮説を立てる際は、チームメンバーや組織外の人と意見交換をする

自身の経験が仮説の範囲を狭めてしまったり、仮説の矛盾に気づかないまま進めてしまったりするケースがよくあります。仮説を立てる際は、社内外の人の意見を聞き、仮説の精度を高めることが重要です。

④ 想定される分析結果を推測する

Point)仮説をつくる時点で、想定される分析結果も想定しておく

仮説を立てたら、“その仮説を実証したらどのような分析結果が出るか”まで考えておきましょう。
たとえば、「売上増加には、テレビCMと新聞広告が効いている」という仮説を立てたときは、「テレビCMは売上の○○パーセント、新聞広告は○○パーセントに影響を与えている」といった分析結果まで想定するようにします。

リスティング広告の流入数に影響を与える要因を推測する図

Step4:データ(仮説を実証するために必要なデータを集める)


「Step4:データ」では、Step3で立てた仮説を実証するために必要なデータを集めます。

分析に必要なデータ

Point)データを集める際は、“仮説を実証するために必要なデータは何か”という視点で考える

持っているデータをそのまま使って仮説を実証しようとすると、場合によっては間違った分析をしてしまいます。以下の例を参考に、“仮説を実証するために必要な形”を考えましょう。

(e.g.)「夏の暑い日ほど売上が落ちる」という仮説を実証したいときは、持っている気温データをそのまま使うのではなく、“仮説を実証するために必要な形に変えて”使う

元データをそのまま使う場合
「8/1は30度、8/2は32度……」といった気温データ

→そのまま使って分析をすると、「季節を問わず、気温が1度上がると売上が●●円下がる/上がる」という、夏に限らない分析結果が得られ、仮説を実証できない。場合によっては誤った分析の示唆を導き出してしまう。

データの形を変えて使う場合
「気温30度以上の日は1、30度未満の日は0」といったフラグを立てたデータ

→「30度以上の日に売上が●●円下がる/上がる」のような、気温と売上の関係性が分かる分析結果が得られ、仮説を実証できる。

Step5:分析(集めたデータを分析する)


集めたデータを、仮説を証明するために適切な分析手法で分析します。
(※詳細は、第2回の記事で解説します)

Step6:解釈(目的から分析までが一気通貫しているか振り返る)


解釈のステップは、このあとアクションを実行すべきかを判断する最後のとりで。目的から分析までが一気通貫しているか否かを振り返る作業=解釈、と考えると分かりやすいです。

データ分析の8ステップ「Step5:分析」は、目的から分析までが一気通貫しているか否かを振り返る作業

Point)振り返りは、Step3で立てた“仮説” と “想定した分析結果” を、実際の分析結果と見比べて行う
(一フェーズずつ戻って確認する必要はありません)

1. 仮説も分析結果も、当初想定していたものと違う場合

①「Step1:目的」に戻り、“どういう目的で分析をしたのか” “特定した課題は何だったか”を確認する
②最初に立てた仮説とは別の因果関係をもとに仮説を立て直す
③再度、「Step4:データ」「Step5:分析」「Step6:解釈」と進める

仮説も分析結果も、当初想定していたものと違う場合の対応

2. 仮説は合っているが、分析結果が当初の想定と違う場合

①「Step4:データ」に戻り、データに間違いがないかを確認する
②正しいデータを集める
③再度、「Step5:分析」「Step6:解釈」と進める

仮説は合っているが、分析結果が当初の想定と違う場合の対応

Step7:巻き込み(データをもとに組織を動かす)


仮説が実証されたら、組織を巻き込んでアクションの実行に進みます。
(※詳細は、第3回の記事で解説します)

データ分析の8ステップは「分析」「巻き込み」「実行」の3セクションから成り立つ

Step8:実行(決定したアクションを実行する)

まとめ

以上、データ分析の8ステップを紹介してきました。

この8ステップを順番にやらないと、目的不在のデータ分析になりやすく、データ分析をアクションの実行まで繋げられない可能性が高まります。

特に、「こんな分析がしたい→こんなデータがほしい→こんな仮説もあるのでは?」と、フローを逆走していくパターンは、いちばんよくないデータ分析だといえます。アクションに繋げられないデータ分析はビジネスで活用できず、分析のための分析で終わってしまいます。

この8ステップを見てもらうと分かるとおり、数学や統計分析の専門知識を必要とするのは「Step5:分析」だけ。データ分析で重要なのは、明確な目的意識と精度の高い仮説、経験が育てる想像力と創造性です。すでに業務に関わっている方なら、これらはきっと持ち合わせていると思います。

はじめてデータ分析をする方も、ぜひ一度、この8ステップを一気通貫で体感してみてください。

▶︎▶︎▶︎ 連載2本目では、ビジネスパーソンが覚えておくべき3つの分析手法を紹介しています。こちらもぜひご一読ください。
【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

データ分析をゼロから学びたい人におすすめの書籍3選 

西内啓(2013)『統計学が最強の学問である』ダイヤモンド社
統計学は何のためにあるのか。何の役に立つのか。現代社会と我々の人生に、統計学が与えるインパクトの大きさを実感できる一冊です。

鳥居泰彦(1994)『はじめての統計学』日本経済新聞出版
数学が苦手な人でも理解できるよう、丁寧に解説された統計学の入門書。統計学とは何かを体系的に理解するためにまず読みたい一冊です。

森岡 毅・今西 聖貴(2016)『確率思考の戦略論』KADOKAWA/角川書店
ユニバーサル・スタジオ・ジャパン(USJ)のV字回復の裏に存在した「数学マーケティング」について詳細に書かれています。データ活用の具体的な事例がイメージできる一冊です。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ 代表取締役CEO 平尾 喜昭 

父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。