データサイエンスは「経験と勘」を活かす手段
AmazonやWalmart、NETFLIXなど、成功した企業の多くがデータを積極的に活用しており、ビジネスの成果を上げる上でデータが重要であることは、誰もが認識するところだ。それでもなお、データというものに苦手意識があり、自分には縁遠いものだと感じている人は少なくないのではないだろうか。
本記事では、データサイエンスによって達成できることと、その可能性の大きさをあらためて見つめるとともに、いま企業がデータサイエンスに取り組む意味・意義を、サイカCEO平尾喜昭に聞く。
POINT
- データサイエンスは「確実性」と「意外な発見」をもたらす
- データサイエンスには8つのプロセスがある
- データサイエンスの実践で重要なのは、目的、課題、仮説の設定と分析結果の解釈
- 「仮説力」はデータサイエンスの実践に欠かせないスキル
- 仮説力の基盤となるのは、一人ひとりが持っている「経験や勘」
株式会社サイカ 代表取締役CEO
平尾 喜昭(ひらお・よしあき)
父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。
目次
「非連続な成長」を実現する、データサイエンスへの期待
── 近年、「データサイエンス」への注目が急速に高まっていますが、その理由をどのようにとらえていますか。
9年前、サイカを創業した2012年と比べると、データサイエンスを取り巻く状況は大きく様変わりしました。当時から、データサイエンスは「重要視」こそされていたものの、より一般的に注目されるようになったのはここ5年ほどのことです。
さまざまな事象をデータ化して収集・蓄積することの重要性が「ビッグデータ」というキーワードとともに語られた、データサイエンスの黎明期。その時期を経て、収集したデータを加工・整理することへの関心が高まっていきました。この頃には、BI(ビジネス・インテリジェンス:ビッグデータを整理・可視化し、経営の意志決定を支援する)ツールを提供する企業が次々と上場を果たすなど、市場が大きく伸びていきました。
そして近年、整理されたデータを分析して“次のアクション”に活かしたいというニーズが高まってきたことで、おのずとデータサイエンスが注目されるようになったのです。
データは「集める」「溜める」「整理する」だけでは意味がなく、目標達成や課題解決のために「分析する」必要がある──いま振り返ってみると当たり前の帰着のように思えます。しかし、世の中に流通するデータが膨大かつ多様になり、データを管理・活用するためのツールが広く普及してきたことを背景に、「せっかく手元にあるデータを、有効に活用したい」と考える人・企業が少しずつ増えてきたのが、この10年ほどの間に起きた変化だったのだと思います。
これに加えて、いくつかの事象が、データ活用の気運の高まりに拍車をかけました。
なかでも潮目を大きく変えたのが2013年に出版された『統計学が最強の学問である』(著:西内啓)です。普段データというものに馴染みがなかった人を含めて、統計学やデータサイエンスの存在が広く一般に知られ、意識されるようになりました。データサイエンティストをはじめとするデータを取り扱う人材が「かっこいい(+稼げる)」存在として認識され始めたのもこの時期だと思います。
映画『マネーボール』(*1)が公開されたのも、GAFAが加速度的に成長していったのも、おおよそ同時期のこと。データを駆使して成功した人や企業のエピソードが“クール”にパッケージングされて発信されたことで、データサイエンスは人々の中で「注目すべきもの」へと急速に変わっていきました。
ひとつポイントと言えるのは、どの事象も、データ活用によって「非連続な成長」を果たしたエピソードだということです。
『マネーボール』のオークランド・アスレチックスは、データを駆使することで2000年から4年連続でプレイオフに出場し、その間に2度、シーズン100勝以上を記録する快挙を成し遂げました。最初は小さなスタートアップだったGAFAは、データを駆使することで非連続的に大手企業へとのし上がっていきました。
これまで見えていなかったこと、気づいていなかったことがデータによって明らかになり、「データを駆使すれば、潤沢な資源がなくとも勝つことができるのではないか」という期待が、人々をさらにデータサイエンスに引き付けたのだと思います。
これまでの延長線上では勝つこと・生き残ることが難しくなった時代、多くの人・企業が待望していた「武器」として、データサイエンスは受け入れられたのだと考えています。
(*1)『マネーボール』
メジャーリーグの貧乏球団を、独自の理論「マネーボール理論」によって常勝球団へと育て上げた、実在する球団ゼネラルマネージャー ビリー・ビーンの半生を描いた映画。マネーボール理論は、各統計から選手を客観的に評価する「セイバーメトリクス」を用いる。
データサイエンスの2つの効果「確実性を高める」「意外な発見をもたらす」
── データサイエンスで実現できることとは、ずばり何でしょうか。
一言で言えば、「確実性を高める」ことです。政治にしろ、ビジネスにしろ、スポーツにしろ、「勝つべくして勝つ」「勝つ確率を上げる」ことができるようになるのが、データサイエンスの力です。
ですから、データサイエンスは「勝つための法則性を導き出す作業」と言い換えることもできますね。
データを使って「確実性を高める」方法には、大きく2つのパターンがあります。「仮説を実証すること」と「仮説を立てるためのヒントを得ること」です。
企業の広告活動を例にとってみると、データを使うことで「売上を高めるためには、広告Aより広告Bを強化すべきなのではないか?」という仮説を検証することもできますし、仮説に反する場合は、これまで想定していなかった広告媒体やクリエイティブの可能性を探ることもできます。
データサイエンスが活きる領域は、もちろん広告だけではありません。「勝つための法則性を導き出す」ことで達成できることの幅は広く、次のようなこともデータサイエンスで実現されてきたことの一例です。
事象をデータ化することさえできれば、データサイエンスを行うことができます。
技術の進歩により、世の中のほとんどすべての事象は何らかの形でデータ化することができますし、どんなデータでも何らかの方法で分析することができます。データサイエンスに達成できない目的・解決できない課題はないといっても過言ではありません。
あらゆる目標達成・課題解決に使えるからこそ、企業規模や業種業態を問わず、「データ活用によって成功した企業」の事例も枚挙にいとまがありません。
NETFLIXは、1998年、わずか30名の社員とともにDVDソフトの郵送レンタル・販売事業を開始しました。同社はプログラミングに精通したデータサイエンティストを雇い、データ分析を駆使したレコメンド機能やパーソナライゼーション、オリジナル作品の企画制作を推進しました。これによって指数関数的な成長を遂げたNETFLIXは、2020年に売上高250億ドル(約2兆5915億円)を達成しています(*2)。
Walmartは、データ分析力を武器に世界最大の小売チェーンへとのし上がりました。同社は定量的な販売・在庫データだけでなく、地域固有のニーズや気象によるニーズの変化など、定性的なデータの分析にも長けていました。また、得られたデータや分析結果をサプライヤーにも提供することで業界全体の成長を後押ししていることでも知られています(*3)。
あえてこうした例を挙げるまでもないほど、データを駆使してビジネスの成果を上げることは、もはや息をするのと同じように、ごく当たり前のことになりつつあります。
(*2)出典:『分析力を武器にする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 』、『Harvard Business Review(https://hbr.org/2018/01/data-can-enhance-creative-projects-just-look-at-netflix)』、『Netflix, Inc.決算資料(https://s22.q4cdn.com/959853165/files/doc_financials/2020/q2/FINAL-Q2-20-Shareholder-Letter-V3-with-Tables.pdf)』)
(*3)
出典:『分析力を武器とする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 』
データサイエンスにおいて最も重要なのは「経験と勘」
── データサイエンスは、具体的にどのように進めていくのでしょうか。
データサイエンスは、❶~❽の8つのプロセスから構成されます。
❶目的:達成したいことは何か
❷課題:何から解決するべきか
❸仮説:何が要因なのか
❹データ:どんなデータが必要か
❺分析:どんな分析を行うべきか
❻解釈:どのような判断を行うべきか
❼巻き込み:どのように組織で動いていくか
❽実行
❶~❽を概観すると、「データ」という言葉が登場するのは、プロセス全体におけるちょうど真ん中あたり。いきなりデータを触り始めるわけではないのです。また、統計やデータ分析の専門性が求められるのは❹❺だけです。
データサイエンスは、実は「データ」「分析」以外の要素が占める割合のほうが高い。ですから、データサイエンスを「理系の人がやること」「統計の専門知識がないとできないもの」と考え、自分には縁遠いものと感じている人が少なくないと思いますが、それは大きな誤解なのです。
むしろ、データサイエンスにおいて最も重要なのは、「目的」「課題」「仮説」で、データ分析の方針を設定すること。そして「解釈」で、目の前に差し出されたデータに関係性を見出し、ストーリー化することです。
これを疎かにすると、いくら大量のデータを手に入れて高精度の分析手法を用いても、データから有効な示唆を得ることも、分析結果を成果につなげることもできません。
逆に、「目的」「課題」「仮説」「解釈」さえできれば、「データ」「分析」については専門人材に任せてもよいのです。
── データサイエンスは、いわゆる“文系”の人でも実践できるのですね。
むしろ、データサイエンスに漠然と苦手意識を持っている“文系”の人のほうが、データサイエンスに向いているケースが多いかもしれません。
世の中のさまざまな事象の間にある因果関係を想像し、仮説を立てること。この「仮説力」こそが、データサイエンスの実践に欠かせないスキルだからです。
昔、とあるコンビニチェーンがデータサイエンティストを大勢雇って「売上に起因する要素」を探るべくデータ分析を行ったところ、導き出された答えは「雨が降ったら売上が下がる」という至極当たり前のことだったという話があります。もちろんこの結果自体が間違っているわけではありませんが、仮説なしに分析しても、データから有効な示唆を得ることはできないということがよくわかる逸話です。
仮説がなければ、データ化されず、分析もされない事象がある。つまり、仮説力がないと気づけないこと・得られないことがあるということです。今後、分析技術がコモディティ化していく中、「仮説力」がデータ分析における優位性はもちろん、ビジネスそのものにおける優位性をも生むといえます。
そして、この「仮説力」の基盤となるのは、一人ひとりが持っている「経験や勘」だと考えています。
たとえば、一般的に、店舗の売上にはネガティブな影響を与えると言われる「雨」。この事象をデータ化して分析する際に、「雨が降ったら売上が下がる」といった仮説を下記のように深掘りしていくと、有効な示唆を得られる可能性が高まります。
■雨は降れば降るほど売上が下がるという仮説の下、降水量を調べる
■雨の量が一定量を超えると売上が下がるという仮説の下、降水量と売上の関係を調べる
■単純に多いか少ないではなく、降水量によって売上に違いがあるという仮説の下、○mm~○mm/△mm~△mm/□mm~□mmのように降水量をカテゴライズし、それぞれについて売上への影響を調べる
■降水量と気温の組み合わせが売上に影響するという仮説の下、降水量だけでなく気温と売上の関係も調べる
小売りの経験があることは、こうした仮説と分析プランを立てる上で非常に有利に働くと言えます。「雨の日でも、来店するお客さまは一定数いる」という経験や、「雨が降っていて、かつ気温が高い日に売上が下がる気がする」といった勘があるからこそ、筋の良い仮説を立て、適切なデータ化の方法を考えることができるのです。
データサイエンスは、経営者やマーケターなど一人ひとりの人が持つ「経験や勘」を、目標達成や課題解決に最大限に活かすためのツールと言えます。
データサイエンスによって、“人間力”で勝負できる時代へ
── データサイエンスに「経験と勘」が活きるというのは、意外な感じがしますね。
一時、マーケティング業界を中心に「データサイエンスは、人の経験や勘に頼らず、データに基づいて法則性を発見し、再現性を高める手法である」という言い方をされていた時期がありましたが、大きな間違いです。
この誤った認識が、データサイエンティスト以外の、いわゆる一般ビジネスパーソンの中にデータサイエンスに対する抵抗感を生み、データサイエンスの普及を阻害する一因にもなってきたように思います。
データサイエンスは、人の経験や勘を最大限に活かすための手段。この正しい認識を広めることで、より多くの人・企業にデータサイエンスを実践してほしいですね。
── より多くの人・企業がデータサイエンスを実践するようになると、社会はどのように変わっていくでしょうか。
「準備は十分整った、あとは自らの才能で勝負するだけ」と言える社会になるのではないでしょうか。実際、そういう社会をつくりたいと考えたのが、サイカ創業のきっかけでした。
現状、データサイエンスは“持つ者と持たざる者”がいる状況。つまり、実践できている企業と実践できていない企業で二極化していて、前者が勝ち続ける状況が出来上がってしまっています。
データサイエンスをより多くの人・企業に行き渡らせることができれば、最後は“人間力”で勝負ができるようになります。ビジネスでいえば、お客さまと向き合い続けることで培われた顧客視点、社会や市場の動向を見極める観察眼、その人独自の感性や感覚、物事にじっくり向き合う胆力や情熱といった、人間ならではの能力をもっと活かせる時代がやってくると思います。
「もっとリソース(ヒト・モノ・カネ・情報)があったら勝てたかもしれないのに」という悔しい思いをせず、自分の才能で勝負できる、納得感のある世界をつくること。それが私の目標であり、データサイエンスが持っている可能性でもあります。
[インタビュー・文]齋藤千明
[撮影]小池大介
[企画・編集]川畑夕子(XICA)