【ゼロから始めるデータ分析】初学者がまず知るべき「分析の8ステップ」

ビジネスにおいてデータ分析の重要性が増していることは周知の事実だ。データドリブンな経営を志向し、すでに動き出している企業や組織も少なくない。

しかし、
「データ分析とは何なのか、実はよく分からない」
「貯まっているデータはあるが、目の前の課題との繋げ方が分からず活用できない」
「データ活用を意識しているつもりだが、思ったような成果が出せていない」
「自分は文系で、統計学や数学、プログラミングに詳しくないからデータ分析はできない」

と動き出せずにいるビジネスパーソンがいることも想像に難くない。

だが実際のところ、ビジネスでのデータ活用は、専門知識がなくてもできることが多い。

この連載は、「データ分析の8ステップ」「知っておくべき3つの分析手法と解釈のコツ」「組織の巻き込み方」の3本立てになっている。

これまでデータ分析を学んだことがない方に向けて、ビジネスにおけるデータ分析の必要性と覚えておくべきデータ分析の基本をポイントを絞って解説し、データをビジネスの成果に繋げるヒントを紹介していく。

ビジネスにデータ分析が必要な理由

自動車を運転するときのことを考えてみてほしい。運転中、運転席前のメーターパネルに表示される速度計やガソリン残量、カーナビなどを確認しながら運転する方がほとんどではないだろうか。

メーターがなくても車は走るし、目的地に到達することもできる。だが、「メーターがない車を買いますか?」と聞かれたら、99.9パーセントの人はきっと買わないと答えるだろう。

それはメーターが、「この速度でこのカーブを曲がり切れるか」「目的地までオイル補給なしで到達できるか」といったことを教えてくれるからだ。また、カーナビが現在地や周辺情報を教えてくれるからこそ、いつも走ったことのない道を走る楽しみを味わうこともできるし、知らなかった抜け道を発見することもできる。

車のメーターは、目的地まで効率よく安全に行ける確度を高め、新しい道を教えてくれる、自動車にとって非常に重要な装置なのだ。

なぜビジネスにデータが必要なのかを考えるときには、データ分析を自動車のメーターに当てはめて考えるとわかりやすい。データを使わないビジネスは、メーターやカーナビのない自動車を運転しているようなものだ。

ビジネスにデータ分析を取り入れることで得られるメリットは、大きく2つある。

一つは、「勝率を高めること」だ。
車のメーターが安全な速度や必要なオイル量を教えてくれるように、データを使うと勝率の高い戦略を導き出すことができる。成果に対して、どの要素がどのくらい影響を与えているのかを方程式化できるからだ。成果と要素の関係性を可視化・数値化すると、成功に再現性がもたらされる

データ分析を取り入れることで得られるもう一つの効果は、「これまで見落としていた欠点を浮き彫りにしたり、思いもよらなかった伸び代を顕在化させたりすること」だ。意外にも、データはクリエイティブの源泉なのである。

データは、貯めれば貯めるほど強化されるより学習できるようになり、精度が上がるからだ。データの蓄積を始めるのが早ければ早いほど、ビジネスの勝率を高めることができる。

デジタル化がますます進む時代、これまで以上に“データに基づいた判断”が必要になってくるだろう。

「データを活用する」とは

具体的なデータ活用のフローを解説する前に、「データ」「データ分析」「データ活用」がそれぞれ何を意味しているかについても整理しておきたい。

データとは


「データ」をあえて定義づけるなら、“世の中の事象を定量化したもの”といえるだろう。つまり、どんなものでも定量化できればデータになるのだ。

データとは何かと聞かれたとき、「2021年8月1日はのり弁当が20個売れた」という購買データや、「2021年7月の平均気温は25.9度であった」という気象データなどを想像する人が多いのではないだろうか。

データは大きく「量的データ(量的変数)」「質的データ(質的変数)」に分類できる。

量的データは、例として挙げたような個数や気温、件数、頻度、身長・体重など、単位のつく数値で表せるもの。一方の質的データは、性別や血液型、好きな芸能人や好き嫌いなど、カテゴリーを区別するものをいい、数値ではなく、「あり・なし」や「A・B・O・A B」などの文字で表される。

技術の進歩により、質的データでも定量化する工夫ができるようになってきた。これからは、データ分析で扱えるデータの種類がますます増えていくことが予想される。

データ分析とは


“データから情報を取り出すこと”をデータ分析といい、データ分析には、「記述統計」「推測統計」という2種類の手法がある。

記述統計は、集めたデータを図表やグラフにし、”データを見やすくして特徴を探る”分析の手法だ。

たとえば、学年ごとの平均身長と平均体重を記録した数値データ。これらを棒グラフや折れ線グラフにすると、学年ごとの平均身長の差異や、身長と体重の関係性が見えやすくなる。このように、データを見やすく加工して、収集したデータの性質を把握する取り組みが記述統計だ。

一方の推測統計は、一部のサンプル(統計学では「標本」という)から全体の傾向を捉え、”データを見てもわからない情報を取り出す”分析の手法である。

たとえば選挙速報。「開票率1%で当選確実」というニュースを見て不思議に思ったことはないだろうか。統計分析はよく味噌汁に例えられる。鍋いっぱいに入っている味噌汁のうち、お玉ですくったひとすくいも同じ味噌汁だ。選挙速報では、開票した表の一部をサンプルとして全体の傾向を探り、当選・落選を判断している。このようにサンプルを取って全体を把握しようという取り組みが推測統計だ。

全国で投票された選挙票をすべて開票するのが難しいように、すべてのデータを集めるのが困難なケースも多くある。そのようなときにはこの推測統計を使う。

データ活用とは


データ分析によって、「身長と体重の増加は比例している」といった情報や、「男子は小学6年生から中学1年生の間の身長の伸びがもっとも大きい」など、何らかの情報が抽出される。

 情報を目的に合わせて解釈し、適用すること”を「データ活用」という。

たとえば、「20:00以降にごはんを食べると太る」という分析結果(情報)があったとする。

この情報を、「スポーツのために体重を●●kg増やしたい」という目的を達成するために活用するのであれば、「夜ごはんの量をこれまでより●●パーセント増やそう」となるだろう。けれどももし、「体重を適正体重まで落としてダイエットに成功したい」が目的であれば、「夜ごはんは●●時までに食べ終わっていたほうがよい」となる。

このように、目的が変われば分析結果の解釈とアクションは大きく変わる。ビジネスでデータを活用する際も、目的の設定は非常に重要だ。

データ分析の8ステップ

ここからは、ビジネスにおけるデータ活用のフローを、8つのステップに分けて紹介していく。

ビジネスでデータを活用するときにもっとも重要なのが、以下のフローに沿って進めることだ。頭から順に進めていき、「おかしい」と思ったら前に戻る。このフローに従わずに進めると、そのデータ分析は失敗に終わる可能性が高い。

Step1:目的(達成したいことを明確にする)


先述のとおり、目的によって解釈やアクションは大きく変わる。まずは、“なぜデータ分析をするのか”という目的を明確にすることが重要。
「売上を最大化したい」「新規事業を成功させたい」など、会社としての大きな目標を自分ごと化し、データを活用して達成したい目的にまで落とし込む作業が、データ分析の最初のステップだ。

Point)当たり前。でも重要な“目的意識”

一見当たり前に思われるかもしれないが、目的があいまいなまま分析をした結果、多大な労力と費用をかけて分析をしたのに有益な示唆が得られずに終わるケースは多い。組織で分析・意思決定・巻き込み・実践への落とし込みを実現するためには、強い目的意識を持つことが重要だ。

Step2:課題(解決したい課題を特定する)


データ分析の目的が明確になったら、目的を達成するために解決すべき課題を特定する。課題を特定するためのアプローチは2つある。

1. 何が課題か想定できる場合:実データから特定する

(e.g.)目的が「売上を最大化したい」の場合:
① 売上を構成する要素を分解

② 要素をシンプルなグラフにし、成果やコストを比較

③ 課題を特定

2.過去のデータがなく、何が課題か想定できない場合(新規事業を創出する場合など):未来の仮説(こうなるのではないか)をつくり、想定される未来の課題を洗い出す

(e.g.)目的が「売上を最大化したい」の場合:
① 未来の仮説を立てる
② 仮説に近い過去のデータを参考に、因果関係を推測する
③ 課題を特定する

Point)課題は、2つのアプローチのいずれかを使って特定する

これらのアプローチを使わずに課題を特定しようとすると、妄想で課題を設定することになる。そうすると、課題を達成しても目的が達成されないという落とし穴にハマってしまうので注意が必要。

Step3:仮説(課題を引き起こす要因を推測する)


課題が明確になったら、その課題を引き起こしている要因を推測する。「Step2:課題の特定」と同じように、ここでも要素の洗い出しと構造化からスタートする。

(e.g.)「リスティング広告の流入数が少ない」が課題の場合:
①「リスティング広告の流入数」を構成する要素を洗い出す
②洗い出した要素を構造化する

Point)構造化したら、「因果関係は正しいか」「MECEになっているか」の2点を確認する

構造化する中で、因果関係の間違いや要素の抜け漏れ・重複があると、精度の高い仮説が立てられない。構造化したら、以下の4点を確認する。

● KPIと要因(施策)が同じステップで扱われていないか
● 課題とKPI/KPIと要因が逆になっていないか
● 課題を説明する要素に漏れがないか
● 要素に重複はないか

③ 課題を引き起こす要因を推測する

Point)仮説を立てる際は、チームメンバーや組織外の人と意見交換をする

自身の経験が仮説の範囲を狭めてしまったり、仮説の矛盾に気づかないまま進めてしまったりするケースがよくある。仮説を立てる際は、社内外の人の意見を聞き、仮説の精度を高めることが重要。

④ 想定される分析結果を推測する

Point)仮説をつくる時点で、想定される分析結果も想定しておく

仮説を立てたら、“その仮説を実証したらどのような分析結果が出るか”まで考えておく。
たとえば、「売上増加には、テレビCMと新聞広告が効いている」という仮説を立てたときは、「テレビCMは売上の○○パーセント、新聞広告は○○パーセントに影響を与えている」といった分析結果まで想定する。

Step4:データ(仮説を実証するために必要なデータを集める)


Step3で立てた仮説を実証するために、必要なデータを集める。

Point)データを集める際は、“仮説を実証するために必要なデータは何か”という視点で考える

持っているデータをそのまま使って仮説を実証しようとすると、場合によっては間違った分析をしてしまう。

(e.g.)「夏の暑い日ほど売上が落ちる」という仮説を実証したいときは、持っている気温データをそのまま使うのではなく、“仮説を実証するために必要な形に変えて”使う

元データをそのまま使う場合
「8/1は30度、8/2は32度……」といった気温データ

→そのまま使って分析をすると、「季節を問わず、気温が1度上がると売上が●●円下がる/上がる」という、夏に限らない分析結果が得られ、仮説を実証できない。場合によっては誤った分析の示唆を導き出してしまう。

データの形を変えて使う場合
「気温30度以上の日は1、30度未満の日は0」といったフラグを立てたデータ

→「30度以上の日に売上が●●円下がる/上がる」のような、気温と売上の関係性が分かる分析結果が得られ、仮説を実証できる。

Step5:分析(集めたデータを分析する)


集めたデータを、仮説を証明するために適切な分析手法で分析する
(※第2回の記事で解説します)

Step6:解釈(目的から分析までが一気通貫しているか振り返る)


解釈のステップは、このあとアクションを実行すべきかを判断する最後のとりで。目的から分析までが一気通貫しているか否かを振り返る作業=解釈、と考えると分かりやすい。

Point)振り返りは、Step3で立てた“仮説” と “想定した分析結果” を、実際の分析結果と見比べて行う
(一フェーズずつ戻って確認する必要はない)

1.仮説も分析結果も、当初想定していたものと違う場合

①「Step1:目的」に戻り、“どういう目的で分析をしたのか” “特定した課題は何だったか”を確認する
②最初に立てた仮説とは別の因果関係をもとに仮説を立て直す
③再度、「Step4:データ」「Step5:分析」「Step6:解釈」と進める

2. 仮説は合っているが、分析結果が当初の想定と違う場合

①「Step4:データ」に戻り、データに間違いがないかを確認する
②正しいデータを集める
③再度、「Step5:分析」「Step6:解釈」と進める

Step7:巻き込み(データをもとに組織を動かす)


仮説が実証されたら、組織を巻き込んでアクションの実行を決定する
(※第3回の記事で詳しく解説します)

Step8:実行(決定したアクションを実行する)

まとめ

以上、データ分析の8ステップを紹介してきた。

この8ステップを順番にやらないと、目的不在のデータ分析になりやすく、データ分析をアクションの実行まで繋げられない可能性が高まる。

特に、「こんな分析がしたい→こんなデータがほしい→こんな仮説もあるのでは?」と、フローを逆走していくパターンはいちばんよくないデータ分析だ。アクションに繋げられないデータ分析はビジネスで活用できず、分析のための分析で終わってしまう。

この8ステップを見てもらうと分かるとおり、数学や統計分析の専門知識を必要とするのは「Step5:分析」だけ。データ分析で重要なのは、明確な目的意識と精度の高い仮説、経験が育てる想像力と創造性だ。すでに業務に関わっている方なら、これらはきっと持ち合わせていると思う。

はじめてデータ分析をする方も、ぜひ一度、この8ステップを一気通貫で体感してみてほしい。

データ分析をゼロから学びたい人におすすめの書籍3選 

『統計学が最強の学問である』西内啓(著)
統計学は何のためにあるのか。何の役に立つのか。現代社会と我々の人生に、統計学が与えるインパクトの大きさを実感できる一冊。

『はじめての統計学』鳥居泰彦(著)
数学が苦手な人でも理解できるよう丁寧に解説された統計学の入門書。統計学とは何かを体系的に理解するためにまず読みたい一冊。

『確率思考の戦略論』森岡 毅・今西 聖貴(著)
ユニバーサル・スタジオ・ジャパン(USJ)のV字回復の裏に存在した「数学マーケティング」について詳細に書かれている。データ活用の具体的な事例がイメージできる。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ 代表取締役CEO 平尾 喜昭 

父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。 

データサイエンスは、「経験と勘」を活かす手段

AmazonやWalmart、NETFLIXなど、成功した企業の多くがデータを積極的に活用しており、ビジネスの成果を上げる上でデータが重要であることは、誰もが認識するところだ。それでもなお、データというものに苦手意識があり、自分には縁遠いものだと感じている人は少なくないのではないだろうか。 

本記事では、データサイエンスによって達成できることと、その可能性の大きさをあらためて見つめるとともに、いま企業がデータサイエンスに取り組む意味・意義を、サイカCEO平尾喜昭に聞く。 

株式会社サイカ 代表取締役CEO 平尾 喜昭(ひらお・よしあき) 
父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。 

「非連続な成長」を実現する、データサイエンスへの期待 

―近年、「データサイエンス」への注目が急速に高まっていますが、その理由をどのようにとらえていますか。 

9年前、サイカを創業した2012年と比べると、データサイエンスを取り巻く状況は大きく様変わりしました。当時から、データサイエンスは「重要視」こそされていたものの、より一般的に注目されるようになったのはここ5年ほどのことです。 

さまざまな事象をデータ化して収集・蓄積することの重要性が「ビッグデータ」というキーワードとともに語られた、データサイエンスの黎明期。その時期を経て、収集したデータを加工・整理することへの関心が高まっていきました。この頃には、BI(ビジネス・インテリジェンス:ビッグデータを整理・可視化し、経営の意志決定を支援する)ツールを提供する企業が次々と上場を果たすなど、市場が大きく伸びていきました。 

そして近年、整理されたデータを分析して“次のアクション”に活かしたいというニーズが高まってきたことで、おのずとデータサイエンスが注目されるようになったのです。 

データは「集める」「溜める」「整理する」だけでは意味がなく、目標達成や課題解決のために「分析する」必要がある──いま振り返ってみると当たり前の帰着のように思えます。しかし、世の中に流通するデータが膨大かつ多様になり、データを管理・活用するためのツールが広く普及してきたことを背景に、「せっかく手元にあるデータを、有効に活用したい」と考える人・企業が少しずつ増えてきたのが、この10年ほどの間に起きた変化だったのだと思います。 

これに加えて、いくつかの事象が、データ活用の気運の高まりに拍車をかけました。 

なかでも潮目を大きく変えたのが2013年に出版された『統計学が最強の学問である』(著:西内啓)です。普段データというものに馴染みがなかった人を含めて、統計学やデータサイエンスの存在が広く一般に知られ、意識されるようになりました。データサイエンティストをはじめとするデータを取り扱う人材が「かっこいい(+稼げる)」存在として認識され始めたのもこの時期だと思います。 

映画『マネーボール』(※1)が公開されたのも、GAFAが加速度的に成長していったのも、おおよそ同時期のこと。データを駆使して成功した人や企業のエピソードが“クール”にパッケージングされて発信されたことで、データサイエンスは人々の中で「注目すべきもの」へと急速に変わっていきました。 

ひとつポイントと言えるのは、どの事象も、データ活用によって「非連続な成長」を果たしたエピソードだということです。 

『マネーボール』のオークランド・アスレチックスは、データを駆使することで2000年から4年連続でプレイオフに出場し、その間に2度、シーズン100勝以上を記録する快挙を成し遂げました。最初は小さなスタートアップだったGAFAは、データを駆使することで非連続的に大手企業へとのし上がっていきました。 

これまで見えていなかったこと、気づいていなかったことがデータによって明らかになり、「データを駆使すれば、潤沢な資源がなくとも勝つことができるのではないか」という期待が、人々をさらにデータサイエンスに引き付けたのだと思います。 

これまでの延長線上では勝つこと・生き残ることが難しくなった時代、多くの人・企業が待望していた「武器」として、データサイエンスは受け入れられたのだと考えています。 

※1:『マネーボール』 
メジャーリーグの貧乏球団を、独自の理論「マネーボール理論」によって常勝球団へと育て上げた、実在する球団ゼネラルマネージャー ビリー・ビーンの半生を描いた映画。マネーボール理論は、各統計から選手を客観的に評価する「セイバーメトリクス」を用いる。

データサイエンスの2つの効果「確実性を高める」「意外な発見をもたらす」 

―データサイエンスで実現できることとは、ずばり何でしょうか。 

一言で言えば、「確実性を高める」ことです。政治にしろ、ビジネスにしろ、スポーツにしろ、「勝つべくして勝つ」「勝つ確率を上げる」ことができるようになるのが、データサイエンスの力です。 

ですから、データサイエンスは「勝つための法則性を導き出す作業」と言い換えることもできますね。 

データを使って「確実性を高める」方法には、大きく2つのパターンがあります。「仮説を実証すること」と「仮説を立てるためのヒントを得ること」です。 

企業の広告活動を例にとってみると、データを使うことで「売上を高めるためには、広告Aより広告Bを強化すべきなのではないか?」という仮説を検証することもできますし、仮説に反する場合は、これまで想定していなかった広告媒体やクリエイティブの可能性を探ることもできます。 

データサイエンスが活きる領域は、もちろん広告だけではありません。「勝つための法則性を導き出す」ことで達成できることの幅は広く、次のようなこともデータサイエンスで実現されてきたことの一例です。 

事象をデータ化することさえできれば、データサイエンスを行うことができます。 

技術の進歩により、世の中のほとんどすべての事象は何らかの形でデータ化することができますし、どんなデータでも何らかの方法で分析することができます。データサイエンスに達成できない目的・解決できない課題はないといっても過言ではありません。 

あらゆる目標達成・課題解決に使えるからこそ、企業規模や業種業態を問わず、「データ活用によって成功した企業」の事例も枚挙にいとまがありません。 

NETFLIXは、1998年、わずか30名の社員とともにDVDソフトの郵送レンタル・販売事業を開始しました。同社はプログラミングに精通したデータサイエンティストを雇い、データ分析を駆使したレコメンド機能やパーソナライゼーション、オリジナル作品の企画制作を推進しました。これによって指数関数的な成長を遂げたNETFLIXは、2020年に売上高250億ドル(約2兆5915億円)を達成しています(※2)。 

Walmartは、データ分析力を武器に世界最大の小売チェーンへとのし上がりました。同社は定量的な販売・在庫データだけでなく、地域固有のニーズや気象によるニーズの変化など、定性的なデータの分析にも長けていました。また、得られたデータや分析結果をサプライヤーにも提供することで業界全体の成長を後押ししていることでも知られています(※3)。  

あえてこうした例を挙げるまでもないほど、データを駆使してビジネスの成果を上げることは、もはや息をするのと同じように、ごく当たり前のことになりつつあります。 

※2 
出典:『分析力を武器にする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 』、『Harvard Business Review(https://hbr.org/2018/01/data-can-enhance-creative-projects-just-look-at-netflix)』、『Netflix, Inc.決算資料(https://s22.q4cdn.com/959853165/files/doc_financials/2020/q2/FINAL-Q2-20-Shareholder-Letter-V3-with-Tables.pdf)』)  

※3 
出典:『分析力を武器とする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 

データサイエンスにおいて最も重要なのは「経験と勘」 

―データサイエンスは、具体的にどのように進めていくのでしょうか。 

データサイエンスは、❶~❽の8つのプロセスから構成されます。 

❶目的:達成したいことは何か 
❷課題:何から解決するべきか 
❸仮説:何が要因なのか 
❹データ:どんなデータが必要か 
❺分析:どんな分析を行うべきか
❻解釈:どのような判断を行うべきか
❼巻き込み:どのように組織で動いていくか
❽実行

❶~❽を概観すると、「データ」という言葉が登場するのは、プロセス全体におけるちょうど真ん中あたり。いきなりデータを触り始めるわけではないのです。また、統計やデータ分析の専門性が求められるのは❹・❺だけです。 

データサイエンスは、実は「データ」「分析」以外の要素が占める割合のほうが高い。ですから、データサイエンスを「理系の人がやること」「統計の専門知識がないとできないもの」と考え、自分には縁遠いものと感じている人が少なくないと思いますが、それは大きな誤解なのです。 

むしろ、データサイエンスにおいて最も重要なのは、「目的」「課題」「仮説」で、データ分析の方針を設定すること。そして「解釈」で、目の前に差し出されたデータに関係性を見出し、ストーリー化することです。 

これを疎かにすると、いくら大量のデータを手に入れて高精度の分析手法を用いても、データから有効な示唆を得ることも、分析結果を成果につなげることもできません。 

逆に、「目的」「課題」「仮説」「解釈」さえできれば、「データ」「分析」については専門人材に任せてもよいのです。 

―データサイエンスは、いわゆる“文系”の人でも実践できるのですね。 

むしろ、データサイエンスに漠然と苦手意識を持っている“文系”の人のほうが、データサイエンスに向いているケースが多いかもしれません。 

世の中のさまざまな事象の間にある因果関係を想像し、仮説を立てること。この「仮説力」こそが、データサイエンスの実践に欠かせないスキルだからです。 

昔、とあるコンビニチェーンがデータサイエンティストを大勢雇って「売上に起因する要素」を探るべくデータ分析を行ったところ、導き出された答えは「雨が降ったら売上が下がる」という至極当たり前のことだったという話があります。もちろんこの結果自体が間違っているわけではありませんが、仮説なしに分析しても、データから有効な示唆を得ることはできないということがよくわかる逸話です。 

仮説がなければ、データ化されず、分析もされない事象がある。つまり、仮説力がないと気づけないこと・得られないことがあるということです。今後、分析技術がコモディティ化していく中、「仮説力」がデータ分析における優位性はもちろん、ビジネスそのものにおける優位性をも生むといえます。 

そして、この「仮説力」の基盤となるのは、一人ひとりが持っている「経験や勘」だと考えています。 

たとえば、一般的に、店舗の売上にはネガティブな影響を与えると言われる「雨」。この事象をデータ化して分析する際に、「雨が降ったら売上が下がる」といった仮説を下記のように深掘りしていくと、有効な示唆を得られる可能性が高まります。 

■雨は降れば降るほど売上が下がるという仮説の下、降水量を調べる
■雨の量が一定量を超えると売上が下がるという仮説の下、降水量と売上の関係を調べる
■単純に多いか少ないではなく、降水量によって売上に違いがあるという仮説の下、○mm~○mm/△mm~△mm/□mm~□mmのように降水量をカテゴライズし、それぞれについて売上への影響を調べる
■降水量と気温の組み合わせが売上に影響するという仮説の下、降水量だけでなく気温と売上の関係も調べる

小売りの経験があることは、こうした仮説と分析プランを立てる上で非常に有利に働くと言えます。「雨の日でも、来店するお客さまは一定数いる」という経験や、「雨が降っていて、かつ気温が高い日に売上が下がる気がする」といった勘があるからこそ、筋の良い仮説を立て、適切なデータ化の方法を考えることができるのです。 

データサイエンスは、経営者やマーケターなど一人ひとりの人が持つ「経験や勘」を、目標達成や課題解決に最大限に活かすためのツールと言えます。 

データサイエンスによって、“人間力”で勝負できる時代へ 

―データサイエンスに「経験と勘」が活きるというのは、意外な感じがしますね。 

一時、マーケティング業界を中心に「データサイエンスは、人の経験や勘に頼らず、データに基づいて法則性を発見し、再現性を高める手法である」という言い方をされていた時期がありましたが、大きな間違いです。 

この誤った認識が、データサイエンティスト以外の、いわゆる一般ビジネスパーソンの中にデータサイエンスに対する抵抗感を生み、データサイエンスの普及を阻害する一因にもなってきたように思います。 

データサイエンスは、人の経験や勘を最大限に活かすための手段。この正しい認識を広めることで、より多くの人・企業にデータサイエンスを実践してほしいですね。 

―より多くの人・企業がデータサイエンスを実践するようになると、社会はどのように変わっていくでしょうか。 

「準備は十分整った、あとは自らの才能で勝負するだけ」と言える社会になるのではないでしょうか。実際、そういう社会をつくりたいと考えたのが、サイカ創業のきっかけでした。 

現状、データサイエンスは“持つ者と持たざる者”がいる状況。つまり、実践できている企業と実践できていない企業で二極化していて、前者が勝ち続ける状況が出来上がってしまっています。 

データサイエンスをより多くの人・企業に行き渡らせることができれば、最後は“人間力”で勝負ができるようになります。ビジネスでいえば、お客さまと向き合い続けることで培われた顧客視点、社会や市場の動向を見極める観察眼、その人独自の感性や感覚、物事にじっくり向き合う胆力や情熱といった、人間ならではの能力をもっと活かせる時代がやってくると思います。 

「もっとリソース(ヒト・モノ・カネ・情報)があったら勝てたかもしれないのに」という悔しい思いをせず、自分の才能で勝負できる、納得感のある世界をつくること。それが私の目標であり、データサイエンスが持っている可能性でもあります。 

インタビュー・文:齋藤千明 
撮影:小池大介 
企画・編集:川畑夕子(XICA)