DATA SCIENCE
2021/09/15

【ゼロから始めるデータ分析】初学者がまず知るべき「分析の8ステップ」

ビジネスにおいてデータ分析の重要性が増していることは周知の事実だ。データドリブンな経営を志向し、すでに動き出している企業や組織も少なくない。

しかし、
「データ分析とは何なのか、実はよく分からない」
「貯まっているデータはあるが、目の前の課題との繋げ方が分からず活用できない」
「データ活用を意識しているつもりだが、思ったような成果が出せていない」
「自分は文系で、統計学や数学、プログラミングに詳しくないからデータ分析はできない」

と動き出せずにいるビジネスパーソンがいることも想像に難くない。

だが実際のところ、ビジネスでのデータ活用は、専門知識がなくてもできることが多い。

この連載は、「データ分析の8ステップ」「知っておくべき3つの分析手法と解釈のコツ」「組織の巻き込み方」の3本立てになっている。

これまでデータ分析を学んだことがない方に向けて、ビジネスにおけるデータ分析の必要性と覚えておくべきデータ分析の基本をポイントを絞って解説し、データをビジネスの成果に繋げるヒントを紹介していく。

ビジネスにデータ分析が必要な理由

自動車を運転するときのことを考えてみてほしい。運転中、運転席前のメーターパネルに表示される速度計やガソリン残量、カーナビなどを確認しながら運転する方がほとんどではないだろうか。

メーターがなくても車は走るし、目的地に到達することもできる。だが、「メーターがない車を買いますか?」と聞かれたら、99.9パーセントの人はきっと買わないと答えるだろう。

それはメーターが、「この速度でこのカーブを曲がり切れるか」「目的地までオイル補給なしで到達できるか」といったことを教えてくれるからだ。また、カーナビが現在地や周辺情報を教えてくれるからこそ、いつも走ったことのない道を走る楽しみを味わうこともできるし、知らなかった抜け道を発見することもできる。

車のメーターは、目的地まで効率よく安全に行ける確度を高め、新しい道を教えてくれる、自動車にとって非常に重要な装置なのだ。

なぜビジネスにデータが必要なのかを考えるときには、データ分析を自動車のメーターに当てはめて考えるとわかりやすい。データを使わないビジネスは、メーターやカーナビのない自動車を運転しているようなものだ。

ビジネスにデータ分析を取り入れることで得られるメリットは、大きく2つある。

一つは、「勝率を高めること」だ。
車のメーターが安全な速度や必要なオイル量を教えてくれるように、データを使うと勝率の高い戦略を導き出すことができる。成果に対して、どの要素がどのくらい影響を与えているのかを方程式化できるからだ。成果と要素の関係性を可視化・数値化すると、成功に再現性がもたらされる

データ分析を取り入れることで得られるもう一つの効果は、「これまで見落としていた欠点を浮き彫りにしたり、思いもよらなかった伸び代を顕在化させたりすること」だ。意外にも、データはクリエイティブの源泉なのである。

データは、貯めれば貯めるほど強化されるより学習できるようになり、精度が上がるからだ。データの蓄積を始めるのが早ければ早いほど、ビジネスの勝率を高めることができる。

デジタル化がますます進む時代、これまで以上に“データに基づいた判断”が必要になってくるだろう。

「データを活用する」とは

具体的なデータ活用のフローを解説する前に、「データ」「データ分析」「データ活用」がそれぞれ何を意味しているかについても整理しておきたい。

データとは


「データ」をあえて定義づけるなら、“世の中の事象を定量化したもの”といえるだろう。つまり、どんなものでも定量化できればデータになるのだ。

データとは何かと聞かれたとき、「2021年8月1日はのり弁当が20個売れた」という購買データや、「2021年7月の平均気温は25.9度であった」という気象データなどを想像する人が多いのではないだろうか。

データは大きく「量的データ(量的変数)」「質的データ(質的変数)」に分類できる。

量的データは、例として挙げたような個数や気温、件数、頻度、身長・体重など、単位のつく数値で表せるもの。一方の質的データは、性別や血液型、好きな芸能人や好き嫌いなど、カテゴリーを区別するものをいい、数値ではなく、「あり・なし」や「A・B・O・A B」などの文字で表される。

技術の進歩により、質的データでも定量化する工夫ができるようになってきた。これからは、データ分析で扱えるデータの種類がますます増えていくことが予想される。

データ分析とは


“データから情報を取り出すこと”をデータ分析といい、データ分析には、「記述統計」「推測統計」という2種類の手法がある。

記述統計は、集めたデータを図表やグラフにし、”データを見やすくして特徴を探る”分析の手法だ。

たとえば、学年ごとの平均身長と平均体重を記録した数値データ。これらを棒グラフや折れ線グラフにすると、学年ごとの平均身長の差異や、身長と体重の関係性が見えやすくなる。このように、データを見やすく加工して、収集したデータの性質を把握する取り組みが記述統計だ。

一方の推測統計は、一部のサンプル(統計学では「標本」という)から全体の傾向を捉え、”データを見てもわからない情報を取り出す”分析の手法である。

たとえば選挙速報。「開票率1%で当選確実」というニュースを見て不思議に思ったことはないだろうか。統計分析はよく味噌汁に例えられる。鍋いっぱいに入っている味噌汁のうち、お玉ですくったひとすくいも同じ味噌汁だ。選挙速報では、開票した表の一部をサンプルとして全体の傾向を探り、当選・落選を判断している。このようにサンプルを取って全体を把握しようという取り組みが推測統計だ。

全国で投票された選挙票をすべて開票するのが難しいように、すべてのデータを集めるのが困難なケースも多くある。そのようなときにはこの推測統計を使う。

データ活用とは


データ分析によって、「身長と体重の増加は比例している」といった情報や、「男子は小学6年生から中学1年生の間の身長の伸びがもっとも大きい」など、何らかの情報が抽出される。

 情報を目的に合わせて解釈し、適用すること”を「データ活用」という。

たとえば、「20:00以降にごはんを食べると太る」という分析結果(情報)があったとする。

この情報を、「スポーツのために体重を●●kg増やしたい」という目的を達成するために活用するのであれば、「夜ごはんの量をこれまでより●●パーセント増やそう」となるだろう。けれどももし、「体重を適正体重まで落としてダイエットに成功したい」が目的であれば、「夜ごはんは●●時までに食べ終わっていたほうがよい」となる。

このように、目的が変われば分析結果の解釈とアクションは大きく変わる。ビジネスでデータを活用する際も、目的の設定は非常に重要だ。

データ分析の8ステップ

ここからは、ビジネスにおけるデータ活用のフローを、8つのステップに分けて紹介していく。

ビジネスでデータを活用するときにもっとも重要なのが、以下のフローに沿って進めることだ。頭から順に進めていき、「おかしい」と思ったら前に戻る。このフローに従わずに進めると、そのデータ分析は失敗に終わる可能性が高い。

Step1:目的(達成したいことを明確にする)


先述のとおり、目的によって解釈やアクションは大きく変わる。まずは、“なぜデータ分析をするのか”という目的を明確にすることが重要。
「売上を最大化したい」「新規事業を成功させたい」など、会社としての大きな目標を自分ごと化し、データを活用して達成したい目的にまで落とし込む作業が、データ分析の最初のステップだ。

Point)当たり前。でも重要な“目的意識”

一見当たり前に思われるかもしれないが、目的があいまいなまま分析をした結果、多大な労力と費用をかけて分析をしたのに有益な示唆が得られずに終わるケースは多い。組織で分析・意思決定・巻き込み・実践への落とし込みを実現するためには、強い目的意識を持つことが重要だ。

Step2:課題(解決したい課題を特定する)


データ分析の目的が明確になったら、目的を達成するために解決すべき課題を特定する。課題を特定するためのアプローチは2つある。

1. 何が課題か想定できる場合:実データから特定する

(e.g.)目的が「売上を最大化したい」の場合:
① 売上を構成する要素を分解

② 要素をシンプルなグラフにし、成果やコストを比較

③ 課題を特定

2.過去のデータがなく、何が課題か想定できない場合(新規事業を創出する場合など):未来の仮説(こうなるのではないか)をつくり、想定される未来の課題を洗い出す

(e.g.)目的が「売上を最大化したい」の場合:
① 未来の仮説を立てる
② 仮説に近い過去のデータを参考に、因果関係を推測する
③ 課題を特定する

Point)課題は、2つのアプローチのいずれかを使って特定する

これらのアプローチを使わずに課題を特定しようとすると、妄想で課題を設定することになる。そうすると、課題を達成しても目的が達成されないという落とし穴にハマってしまうので注意が必要。

Step3:仮説(課題を引き起こす要因を推測する)


課題が明確になったら、その課題を引き起こしている要因を推測する。「Step2:課題の特定」と同じように、ここでも要素の洗い出しと構造化からスタートする。

(e.g.)「リスティング広告の流入数が少ない」が課題の場合:
①「リスティング広告の流入数」を構成する要素を洗い出す
②洗い出した要素を構造化する

Point)構造化したら、「因果関係は正しいか」「MECEになっているか」の2点を確認する

構造化する中で、因果関係の間違いや要素の抜け漏れ・重複があると、精度の高い仮説が立てられない。構造化したら、以下の4点を確認する。

● KPIと要因(施策)が同じステップで扱われていないか
● 課題とKPI/KPIと要因が逆になっていないか
● 課題を説明する要素に漏れがないか
● 要素に重複はないか

③ 課題を引き起こす要因を推測する

Point)仮説を立てる際は、チームメンバーや組織外の人と意見交換をする

自身の経験が仮説の範囲を狭めてしまったり、仮説の矛盾に気づかないまま進めてしまったりするケースがよくある。仮説を立てる際は、社内外の人の意見を聞き、仮説の精度を高めることが重要。

④ 想定される分析結果を推測する

Point)仮説をつくる時点で、想定される分析結果も想定しておく

仮説を立てたら、“その仮説を実証したらどのような分析結果が出るか”まで考えておく。
たとえば、「売上増加には、テレビCMと新聞広告が効いている」という仮説を立てたときは、「テレビCMは売上の○○パーセント、新聞広告は○○パーセントに影響を与えている」といった分析結果まで想定する。

Step4:データ(仮説を実証するために必要なデータを集める)


Step3で立てた仮説を実証するために、必要なデータを集める。

Point)データを集める際は、“仮説を実証するために必要なデータは何か”という視点で考える

持っているデータをそのまま使って仮説を実証しようとすると、場合によっては間違った分析をしてしまう。

(e.g.)「夏の暑い日ほど売上が落ちる」という仮説を実証したいときは、持っている気温データをそのまま使うのではなく、“仮説を実証するために必要な形に変えて”使う

元データをそのまま使う場合
「8/1は30度、8/2は32度……」といった気温データ

→そのまま使って分析をすると、「季節を問わず、気温が1度上がると売上が●●円下がる/上がる」という、夏に限らない分析結果が得られ、仮説を実証できない。場合によっては誤った分析の示唆を導き出してしまう。

データの形を変えて使う場合
「気温30度以上の日は1、30度未満の日は0」といったフラグを立てたデータ

→「30度以上の日に売上が●●円下がる/上がる」のような、気温と売上の関係性が分かる分析結果が得られ、仮説を実証できる。

Step5:分析(集めたデータを分析する)


集めたデータを、仮説を証明するために適切な分析手法で分析する
(※第2回の記事で解説します)

Step6:解釈(目的から分析までが一気通貫しているか振り返る)


解釈のステップは、このあとアクションを実行すべきかを判断する最後のとりで。目的から分析までが一気通貫しているか否かを振り返る作業=解釈、と考えると分かりやすい。

Point)振り返りは、Step3で立てた“仮説” と “想定した分析結果” を、実際の分析結果と見比べて行う
(一フェーズずつ戻って確認する必要はない)

1.仮説も分析結果も、当初想定していたものと違う場合

①「Step1:目的」に戻り、“どういう目的で分析をしたのか” “特定した課題は何だったか”を確認する
②最初に立てた仮説とは別の因果関係をもとに仮説を立て直す
③再度、「Step4:データ」「Step5:分析」「Step6:解釈」と進める

2. 仮説は合っているが、分析結果が当初の想定と違う場合

①「Step4:データ」に戻り、データに間違いがないかを確認する
②正しいデータを集める
③再度、「Step5:分析」「Step6:解釈」と進める

Step7:巻き込み(データをもとに組織を動かす)


仮説が実証されたら、組織を巻き込んでアクションの実行を決定する
(※第3回の記事で詳しく解説します)

Step8:実行(決定したアクションを実行する)

まとめ

以上、データ分析の8ステップを紹介してきた。

この8ステップを順番にやらないと、目的不在のデータ分析になりやすく、データ分析をアクションの実行まで繋げられない可能性が高まる。

特に、「こんな分析がしたい→こんなデータがほしい→こんな仮説もあるのでは?」と、フローを逆走していくパターンはいちばんよくないデータ分析だ。アクションに繋げられないデータ分析はビジネスで活用できず、分析のための分析で終わってしまう。

この8ステップを見てもらうと分かるとおり、数学や統計分析の専門知識を必要とするのは「Step5:分析」だけ。データ分析で重要なのは、明確な目的意識と精度の高い仮説、経験が育てる想像力と創造性だ。すでに業務に関わっている方なら、これらはきっと持ち合わせていると思う。

はじめてデータ分析をする方も、ぜひ一度、この8ステップを一気通貫で体感してみてほしい。

データ分析をゼロから学びたい人におすすめの書籍3選 

『統計学が最強の学問である』西内啓(著)
統計学は何のためにあるのか。何の役に立つのか。現代社会と我々の人生に、統計学が与えるインパクトの大きさを実感できる一冊。

『はじめての統計学』鳥居泰彦(著)
数学が苦手な人でも理解できるよう丁寧に解説された統計学の入門書。統計学とは何かを体系的に理解するためにまず読みたい一冊。

『確率思考の戦略論』森岡 毅・今西 聖貴(著)
ユニバーサル・スタジオ・ジャパン(USJ)のV字回復の裏に存在した「数学マーケティング」について詳細に書かれている。データ活用の具体的な事例がイメージできる。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ 代表取締役CEO 平尾 喜昭 

父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。