データを武器にできないマーケターは生き残れない時代が来た

メディアの多様化やコロナ禍による消費者の生活変化、個人情報保護規制の強化など、マーケティングを取り巻く環境は変わり続けている。

変化に適応できない企業は、本当に生き残れない時代が来たのだ。

では、こうした環境の変化にマーケター、ひいては経営陣はどう対応すべきか。
データをどのように戦略に役立てればいいのか。

マーケティング起点の経営でネスレ日本を急成長させた高岡浩三氏と、知識や経験だけに頼らないデータドリブンなマーケティングを支援する株式会社サイカCEOの平尾喜昭氏の対話から、変化に強いマーケティングの要諦を穿つ。

高岡浩三と平尾喜昭の対談

日本のマーケティングの課題はROI意識の低さ

高岡浩三(以下高岡)  よく「コロナ禍でマーケティングにはどんな変化が起きましたか」という質問をいただきます。

ですが、コロナをきっかけに急に変わったことなんてほぼありません。「これまでもあったが、見ようとしてこなかった変化」の対応を迫られただけなのです。

ケイアンドカンパニー株式会社代表取締役・高岡浩三氏

たとえば、DX(デジタル・トランスフォーメーション)。これまでもデジタルの時代だと言われてきましたが、実際にマーケティングに組み込めていた企業は一握りでした。

それが、コロナでリアルの活動が制限され、デジタルを活用せざるを得なくなったわけです。

平尾喜昭(以下平尾)  日々多くのマーケターの方と接していますが、「変化が加速しただけ」というご指摘には非常に共感します。

私たちサイカはデータサイエンスに基づき、テレビCMを含めた広告効果の可視化や最適な予算配分、クリエイティブ設計からテレビCMのプランニング・バイイングまでをトータルで支援する「ADVA(アドバ)」というサービスを展開しています。

データ分析の可能性を信じ、5年ほどツールを提供してきましたが、コロナ禍でこれまで以上にこの領域への期待が急速に高まっていると感じます。

サイカが提供するADVAの全容

高岡 サイカのことは以前から知っていましたよ。テレビCMというほぼ効果検証がされていなかった領域に切り込んだのが素晴らしい。

私がいたネスレ日本(以下ネスレ)などの外資企業は、テレビでもデジタルでも、どれくらい広告投資が売り上げに貢献したか=ROI(Return on Investment、投資利益率)をシビアに分析します。

「長く続くブランドを作る」という思想のもと、中長期的なマーケティング戦略を立てる必要があるからです。

一方、日本企業は次々と新商品を作ってスピード重視で売る、というやり方が一般的でした。まずはたくさん認知を取ろうという考えゆえに、ROIの検証が後回しになっていたのでしょう。

平尾 私が感じた課題はまさにそこでした。高岡さんもご存じの通り、欧米では1950年代からMMM(マーケティング・ミックス・モデリング)のもと、さまざまなマーケティング活動をデータで可視化するカルチャーが根付いています。

ところが、日本ではこの「効果の可視化」という部分に光が当てられてきませんでした。

MMMとは何か

ですが、コロナ禍をきっかけに経営のコスト意識も厳しくなり、マーケティング施策への説明責任も重くなっている。そこで、広告のROIを可視化したいというニーズが高まったのだと思います。

高岡 それはあるでしょうね。私も、広告施策のROIがわかっていたからこそ、数十億あったテレビの広告予算をゼロにして「キットカット」の受験生応援キャンペーンを立ち上げました。

キットカットはすでに認知のあるブランドだったため、テレビ広告が得意な「認知獲得」以外の部分に予算を使う戦略に切り替えたのです。

2000年代初めにネスレが公開した、『キットカット』の広告
2000年代の初めに、ネスレ日本は九州の方言「きっと勝っとお」に響きが似ていることを背景に、『キットカット』を受験の応援アイテムとして位置づけるコミュニケーションを展開。(写真出典:ネスレ日本公式HP https://nestle.jp/brand/kit/juken2021/)

コロナをきっかけにROIへの意識が変化した。これからは、ブランドなりサービスなりが、「本当に今投資すべき施策」を見極められるかがカギになるでしょう。

データは「建設的な議論」の必須要素

平尾 マーケティングや経営の現場に長くいらっしゃる高岡さんから見て、マーケティングのROIが根付いている企業とそうでない企業の差はどこにあると思いますか。

サイカ代表取締役CEO・平尾喜昭

高岡 一つは、経営者がマーケティングをわかっているかどうかです。

顧客の課題を発見し、それを解決する商品を作って届ける。私は、企業活動のすべてとも言えるこのプロセスを「マーケティング」と定義していますが、残念ながらこの一連をきちんと捉えられている経営者は日本にはほぼいません。

現場にはこれらを捉えた素晴らしいマーケターがいるのですが、トップの意識が変わらないと予算配分にも反映されない。当然、企業全体のROIへの解像度も低いままです。

平尾 日本ではマーケティングがコストセンターとして扱われることも多いですが、高岡さんがネスレで証明したように、本来は経営そのものであり、利益を生み出すプロフィットセンターですよね。

高岡浩三と平尾喜昭の対談

私たちもさまざまな企業をご支援していますが、マーケティングが強い会社からはおしなべてリーダーの強い意思を感じます。

高岡 逆に言えば、トップがきちんとゴールを掲げないと、現場がKPIやKGIを設定するときにブレが生じます。

変化に強いマーケティングの条件1:経営層がマーケティングに強い意思を持っている

トップと現場、そして現場同士が議論をする上で、ベースとなるのが数字やデータといったファクトです。特にネスレは外資企業ですから、ファクトが言語やバックグラウンドの違う人たちの共通言語として機能していたわけです。

一方、日本企業ではファクトを用いた議論が少なすぎる。もちろん、経験や感覚での意思決定も大切ですが、それに寄りすぎるのは危ういな、と。

平尾 実は、私たちはもともとマーケティングに限らず、あらゆる分野に向けてデータを活用したコンサルティング業を展開していました。

ですが、数年やってみてクライアントがほとんどマーケターだと気づきました。それくらい、他分野よりもマーケティングや広告の世界はデータを用いた議論が社内で少なかったのだと推察します。

そこで、当時のマーケターの課題を解決するために開発したのが、テレビCMを含めたオンライン・オフラインの広告効果を可視化するツール「ADVA MAGELLAN(アドバ マゼラン)」です。

ADVA MAGELLAN

高岡 素晴らしい。特に、日本企業だと声の大きい人の意見が通ってしまうことも多いですが、ファクトがあれば建設的な議論ができる。

ファクトはマーケティング戦略だけではなく、健全なマーケティング組織をつくっていく上でも欠かせない要素です。

いくら優秀なマーケターが優れた戦略を出したとしても、ロジックのない「鶴の一声」で方針が変わってしまったら、モチベーションを維持するのが難しいでしょうから。

変化に強いマーケティングの条件2:ファクトを用いた建設的な議論ができる

仮説なきデータ分析には意味がない

平尾 これまで10年ほどデータ分析の世界にいて、よく耳にする勘違いに「データ=過去を実証するもの」があります。

データ分析で、過去の施策を振り返ることもできますが、結果を出している企業は、何らかの仮説を立てた上で、未来の施策のために分析に取り組んでいるんですね。

この「仮説」という部分が非常に重要です。データを見る時の「軸」がないまま分析をしても、ぼんやりとした結果しか得られません。

サイカ代表取締役CEO・平尾喜昭

高岡 私もよく、「消費者調査をいくらしてもヒット商品やすごいキャンペーンはできない」と言っています。それは、結果ばかりを見ていて仮説がないからです。

逆に、仮説さえあれば、どんなデータも強力な武器になります。

ネスレで「1杯ずつ抽出可能なコーヒーマシーン」を作ったときもそうです。

核家族化が進むなか、一気に4杯、5杯を作れる従来のコーヒーマシンではなく、1杯ずつコーヒーを沸かしたい人が多いのではないか、という仮説を立てました。

それをアンケートで分析したところ、賛同の声が多く、商品化に至ったわけです。

平尾 私もよく、クライアントに「目的→問題意識→仮説→データ分析→意思決定」の流れが大切だと提案するのですが、目的がないと問題が特定できないし、問題意識がないと仮説は得られない。

さらに、仮説がないと良い分析もできない……と、目的や仮説が曖昧なままデータ分析という「手段」から入る、つまりデータ分析が「目的」になるのは間違いなんですよね。

変化に強いマーケティングの条件3:データ分析に目的や仮説がある

分析ツールを提供する私たちが言うのも少し変ですが(笑)、手法がいくら進化したとしても、結局は顧客のことを考え抜いているかどうか。それがマーケティングの成否をわけるのだと思います。

高岡 結局、自分の頭でどれくらい考えられているか、ということですよね。

よく「変化の激しい時代」なんて言うけれど、その変化の中身についてちゃんと考えられている人って実は少ない。

私は変化の定義を、平尾さんが今おっしゃったような「顧客の問題がどう変わったか」と置いています。

外部環境が変化するのは当たり前なのだから、まずは目の前のお客さんが何に今困っていて、何を欲しているのかを考える。それに向き合わないと、変化に踊らされるだけですから。

変化に強いマーケティングの条件4:外部環境が変わろうと顧客の問題を考え抜く

「資料作り」にばかり時間を割く人々

高岡 ただ、マーケティングの現場に目を向けると、「考える」という部分に時間を使えている人は一握りです。

マーケターが考えごとに使えるのは、業務時間の7%というデータもあるほどで、資料を作ったり、データを集めたりすることに多くの時間を奪われている。

マーケター個人というより仕組みの問題なんですが、はっきり言って資料作りって仕事じゃなくて作業なんですよ。マーケティングの本来の使命である「顧客の課題の発見と解決」に向き合えている人が少ないのは問題です。

変化に強いマーケティングの条件5:マーケティングの使命は「顧客の課題の発見と解決」

平尾 テクノロジーの進化によって作業が自動化されていくと、マーケティング本来の仕事をしている人とそうでない人の差がどんどん広がっていきますよね。

先ほどの話にも通じますが、目的や仮説を捉えられる人はデータを使って戦略も組み立てられるし、実行フェーズでもPDCAを回せます。

短期の顧客獲得単価(CPA)などに逃げず、あくまで経営者と同じ目線を持って、です。

高岡 そうですね。「考える」の先にある「実行」が大切で、結局手を動かしてみないとわからないことが山ほどあります。

顧客から選ばれるブランドやサービスというのは、もちろん戦略自体も素晴らしいのだけど、実行していくなかでフィードバックを吸収して必ずブラッシュアップをしています。

サイカのADVAシリーズも、顧客がこれまで無理だと思っていた「テレビCMの効果分析」という課題をなんとか解決しようと試行錯誤して、その過程で得たいろんな手応えを反映してきたからこそ今の形があるんだと思うんですね。

高岡浩三と平尾喜昭の対談

平尾 ありがとうございます。まさに、分析は顧客のニーズからスタートした事業ですし、後からはじめた広告の代理事業なども、分析だけでなく実践フェーズまで支援してほしいというご要望を受けて展開したサービスです。

せっかく分析結果が得られても、次の戦略に生かせなければ「絵に書いた餅」になってしまう。ならば、それを一貫で支援しますよ、とサービスを広げたんです。

高岡 そう考えると、データ分析のところでお話しした仮説が大事だという話は、ビジネスを作っていく上でも同じなんですよね。

繰り返しになりますが、変化に強いマーケティングやビジネスは、顧客の課題を解決するという目的があり、そのための仮説検証ができているかどうか。それに尽きます。

変化に強いマーケティングの条件6:仮説検証の積み重ねが「強さ」につながる

強調しておきたいのは、仮説の時点ではいくら間違っていてもいい、ということです。それを繰り返すことで、また新しい仮説が生まれて正解に近づけますから。

平尾 おっしゃる通りですね。そして、その仮説を確かめる手段として、データという強力な武器があるので、データサイエンスをマーケター、ひいてはすべての企業の方にご活用いただきたいです。

まだまだ日本で浸透していないデータドリブンなマーケティングを広げていけるよう、私たち自身も試行錯誤を重ねていきます。

マーケティングにデータという武器を。サイカ

[編集]高橋智香・大高志帆
[撮影]小池彩子・後藤渉
[デザイン]月森恭助
NewsPicks Brand Designにて取材・掲載されたものを当社で許諾を得て公開しております。

クッキーレス時代、日本がマーケティングにMMMを取り入れるべき3つの理由

マーケティング先進国アメリカで、約8割のマーケターが認知し、約半数の企業が実践している(*1)マーケティング分析手法「マーケティング・ミックス・モデリング(MMM)」。日本ではまだ1割の企業でしか導入が進んでいない(*2)MMMですが、実はさまざまなポイントで、現代のマーケティング環境に最適な分析手法であるといえます。

この記事では、日本において主流とされているMTAとMMMの違い、そしてMMMが次世代のマーケティングに最適といえる理由をお伝えします。

(*1) ニールセン・メディア、Facebook、Googleによるコンソーシアム最新レポート「マーケティング・ミックス・モデリングを活用して広告のパフォーマンスを向上させる方法」発行のお知らせ(ニールセン・メディア・ジャパン合同会社のプレスリリース)https://prtimes.jp/main/html/rd/p/000000004.000070691.html
(*2)企業の広告宣伝担当者212名に聞いた 広告の効果測定方法に関するアンケート調査 2020年版(株式会社サイカのプレスリリース)https://www.atpress.ne.jp/news/213842

MMMは、現代のマーケティング環境に合った効果測定手法

現代のマーケターは、数多くのメディアやチャネルを組み合わせたマーケティングコミュニケーションの展開を求められています。このように複雑化した環境下で成果を最大化するためには、各施策の効果を正しく把握するだけでなく、施策間の相乗効果を最大化する必要があります

「マーケティング・ミックス・モデリング(MMM)」は、さかのぼること70年以上前、1950年代のアメリカで誕生しました。テレビCM・ラジオ広告・交通広告・新聞広告といったオフラインのマーケティング施策が売上に与える影響の可視化を目的に開発されたものです。

そこから進化を遂げた現代のMMMは、オンライン・オフラインを問わず、さまざまなマーケティング施策が成果に与える影響を定量化できる効果測定手法となりました。あらゆるマーケティング施策を統合的に分析することから、「統合アトリビューション分析(*3)」とも呼ばれます。

(*3)アトリビューション分析:各マーケティング施策の成果(売上)への貢献度を定量的に測定する分析のこと。

このMMMが現代のマーケティング環境に合っているといえる理由が3つあります。

1つ目は、各マーケティング施策の「成果への影響(直接効果)」と「ほかのマーケティング施策への影響(間接効果)」の両方を数値化できること。

2つ目は、自社でコントロールできない外部要因についても分析できることです。

外部要因とは、市場環境(競合他社の広告や販売施策など)、季節性、天候など、マーケティング施策の効果や業績に影響を及ぼす可能性のあるあらゆる要因を指します。

たとえマーケティング施策が完璧だったとしても、競合他社が大幅な値下げを実施すれば販売数は減少するでしょうし、台風が来れば来客数は減少します。近年で言えば、COVID-19の影響は、マーケティング施策の成否にかかわらず、売上に大きなインパクトを与えました。

逆に、自社のマーケティング施策が成功したわけでなくとも、外部的な要因により売上が向上するケースもあります。

3つ目は、ブランド・エクイティ(ブランドが持つ価値のことで、製品やサービスの価値を増大させるもの)など、数ヶ月から数年単位に及ぶ中長期的な施策の成果と、短期的なマーケティング施策の成果とを分解してとらえられることです。

応用的なアプローチではありますが、ブランド力は、マーケティング成果のベースとなるものです。自社やサービスがどのくらい知られているのか。良い印象を持ってもらえているのか。そしてそれらがどのくらい成果に影響しているのか。これらを可視化することで、必要な施策も変わってくるはずです。

このように、MMMはこれまで効果の可視化が難しいとされてきた施策同士の相乗効果や外部要因の影響、ブランド価値といったあらゆる要因を包括的に把握し、「マーケティング施策の真の効果」を数値化します。

マーケティング施策の種類が多様化し複雑になった現代においても、個別最適ではなく全体最適で広告予算を最適化し、マーケティング成果を最大化するためのヒントを得られるのがMMMなのです。

日本企業のMMM活用率は約1割

MMMは、発祥の地でありマーケティング先進国である米国では、企業の規模や業種業態を問わず広く活用されています。一方、日本ではMMMのような高度な分析はまだあまり行われていないのが現状です。

サイカが2020年4月に実施した調査「企業の広告宣伝担当者212名に聞いた、広告の効果測定方法に関するアンケート調査 2020年版」でも、それが明らかになりました。

広告宣伝担当者を対象に、「現在用いている分析手法と今後用いたい分析手法」を尋ねたところ、「統計モデル・AI・機械学習などの技術を用いた広告効果の数値化、および最適な予算配分のシミュレーション」を現在活用していると回答した企業はわずか11.2%と、約1割にとどまりました。過去の調査と比較しても、2018年は4.9%、2019年は10.7%となっており、増加傾向にはあるものの、国内全体でみると導入企業はいまだ多いとはいえない状況です。

一方、「統計モデル・AI・機械学習などの技術を用いた広告効果の数値化、および最適な予算配分のシミュレーション」を今後活用したいと回答した企業は49.7%と約半数にのぼりました。2018年の調査時から3年連続で増加しており、高度な分析手法へのニーズは拡大傾向にあります。

広告宣伝担当者をに聞いた、現在用いている分析手法
広告宣伝担当者をに聞いた、今後用いたい分析手法

また、同調査では、オンライン施策・オフライン施策・外部要因などを統合した、領域横断的な分析がどの程度実践されているかも調査しました。

現在取り組んでいる分析として「インターネット広告・オフライン広告を領域ごとで分けて分析」が44.3%と最多だったのに対し、今後取り組みたい分析としては「インターネット広告・オフライン広告に加えて外部的な影響要因も含めた統合的な分析」が36.8%と最多です。

この結果を見ても、日本企業においては、MMMのような高度かつ領域横断的な分析手法へのニーズは高いものの、実践できていないのが現状のようです。

広告宣伝担当者をに聞いた、現在取り組んでいる分析と今後取り組みたい分析

日本ではMTA、世界ではMMMが高評価

MMMを活用している企業が約1割にとどまる日本で、現在主流となっている分析手法が「マルチ・タッチ・アトリビューション(MTA)」です。

MTAは、クッキーなど個人の行動ログデータをもとに、デジタル広告が売上などの事業成果に与える影響を測定します。

MTAとMMMは、過去のデータを分析して施策の売上貢献度やROIを算出し、広告予算の最適化を検討する手法である点では同じですが、分析のベースとなるデータが違います。MTAは各タッチポイントの接触データをベースにしますが、MMMは売上に影響していると考えられる要因の、時系列ごとの連動性をベースにします。

MTAは、マーケティングも販売もオンラインで完結しているEC事業者などの場合、非常に精度の高い分析が可能です。一方、オンラインとオフラインを組み合わせて施策を展開している企業の場合、オフライン施策における個人の行動データを取得することが難しく、MTAのみでの詳細な分析は難しくなります。

では、MTAとMMM、どちらが現代のマーケティングに適した分析手法なのでしょうか。

サイカが実施した、米国におけるマーケティング効果測定の歴史と最新動向調査によると、2016年以降、MTAとMMMを組み合わせた統合分析でマーケティングを測定・最適化することが企業の差別化のポイントとなっていることが分かりました(*4)

また、米国でMMMとMTAを融合したマーケティングの効果測定・最適化サービス、コンサルティングを提供するAnalytic Partnersは、2019年11月、「クライアントに提供する最適化のヒントのうち、増加価値の80%がMMMによるインサイトから得られ、MTAは残り20%にしか貢献していない」との調査結果を発表(*5)しました。
施策同士の関わりや時系列ごとの施策の連動性を明らかにしてくれるMMMは、タッチポイントごとの効果測定を得意とするMTAよりも、マーケティング全体の最適化につながるヒントを得やすいということでしょう。

米国では、社内にMMMを実践する専門チームが設置されている企業や、MMMツールを提供している事業者も増えてきました。このことからも、MMMが有効な分析手法として認められ、急速に浸透してきたことがうかがえます。

(*4)以下URL参照
・Market Guide for Attribution and Marketing Mix Modeling (Gartner, Inc. )https://www.gartner.com/en/documents/3463318/market-guide-for-attribution-and-marketing-mix-modeling
・The Forrester Wave™: Marketing Measurement And Optimization Solutions, Q1 2020(Forrester)https://www.forrester.com/report/The-Forrester-Wave-Marketing-Measurement-And-Optimization-Solutions-Q1-2020/RES145975
・The Forrester Wave: Marketing Measurement and Optimization Solutions, 2016 (Forrester)https://www.forrester.com/blogs/16-10-12-the_forrester_wave_marketing_measurement_and_optimization_solutions_2016/
 ​​(*5)Disrupting MTA: Introducing Commercial Mix Modeling(Analytic Partners)https://analyticpartners.com/news-blog/2019/11/disrupt-mta-commercial-mix/

「クッキーレス時代」到来で、日本でもMMMの導入が加速

日本では導入が遅れているMMMですが、いくつかの理由から、今後は日本でも導入が進んでいくと考えられます。なかでも最も大きな理由は、データ規制・プライバシー保護強化の流れがグローバルで加速していることにあります。

欧州連合の「EU一般データ保護規則(General Data Protection Regulation:GDPR)」(2018年施行)、米・カリフォルニア州の「カリフォルニア州消費者プライバシー法(California Consumer Privacy Act:CCPA)」(2020年施行)をはじめ、各国・各地域がデータプライバシーに関する取り組みを進めているほか、Appleが2021年春のiOS 14.5ベータ版リリースに合わせて発表した「広告識別子(IDFA)の取得制限」、Google Chromeをはじめとする各Webブラウザにおける「サードパーティークッキーの廃止」など、近年、データプライバシー保護に関する動きが活発化しています。

これは、オンライン上で取得できる顧客に関するデータの量、種類、粒度、そして活用目的が大きく制限されることを意味します。つまり、個人の行動データにもとづいて分析を行うMTAの精度を担保することが、技術的に難しくなっていく可能性が高いのです。

MMMは、クッキーなどを用いた個人の行動データにもとづくリアルタイムの分析は行いません。分析で利用するデータは、広告出稿量(テレビCMのGRP、デジタル広告のインプレッション数やクリック数など)、コスト、成果(来店客数、売上、申込数・契約数などのコンバージョン数)、および市場環境・季節性・天候といった外部要因に関するデータです。

このように、クッキーレス時代にも、マーケティング活動を正確かつ持続的に測定できる手法がMMMなのです。

日本でMMMを実践する3つの方法

日本企業においてもすでに潜在的ニーズは非常に高く、今後さらに需要が高まっていくとみられるMMM。実践する方法は主に3つあります。以下では、それぞれのメリット/デメリットとともにご紹介します。

1. 調査会社・コンサルティング会社に分析を依頼する

  • メリット:プロのデータサイエンティストによってデータ分析の調整が丁寧に行える/提供企業が比較的多く、サービスの選択肢が多い
  • デメリット:費用が高額/分析結果が出るまでに3~6カ月とやや時間がかかる

2. データサイエンティストを自社で雇用する

  • メリット:自社の課題を理解した上で分析するので、分析結果を次のアクションにつなげやすい
  • デメリット:データサイエンティストの採用は非常に難易度が高いため、採用までに多くのコストを必要とする場合が多い/採用市場にいるデータサイエンティストの数が少ない

3. MMM分析ができるツールを活用する

  • メリット: 専門知識がなくても短時間で分析できる/調査会社・コンサルティング会社に依頼するよりも安価
  • デメリット:日本ではMMM分析ツールがほとんど提供されておらず、ツールの選択肢が少ない

これらの方法について、「次のアクションへのつなげやすさ(問題意識・仮説の精度)」「分析にかかる時間」「分析にかかる費用」「選択肢の多さ」という4つのポイントで比較したのが下表です。

現代、そして次世代のマーケティングにおいて、各施策の売上への貢献や、施策間の相乗効果を正しく評価するためのデータ分析は、もはや必要不可欠です。

限りあるリソースを無駄遣いせず、適切な投資で最大限の成果を得るために、自社の事業の特徴やマーケティング戦略に合った効果測定手法を選択して、あるいは組み合わせて活用することが重要です。

データ保護・プライバシー規制強化などの社会動向もにらみながら、自社のマーケティング効果測定の今後のあり方について、改めて検討・議論してみてはいかがでしょうか。

【ゼロから始めるデータ分析#3】データ分析の現場から他部署と経営陣を巻き込む4つのTips

これまでデータ分析を学んだことがない方に向けて、データ分析の基礎を解説していく本連載。「データ分析の8ステップ」「覚えておくべき3つの分析手法」「他部署と経営陣を巻き込む4つのTips」の3本立てでお送りしています。

第1回では、データ分析の基本となる8ステップを解説し、第2回では、ビジネスパーソンが覚えておいて損はない3つの分析手法をご紹介してきました。 

これまでの記事でもお伝えしてきたとおり、データ分析は分析をして終わりではありません。分析結果にもとづくアクションを起こし成果につなげてこそ、データは活用できているといえます。

アクションを起こす上で大事なのが、経営陣や他部署など、組織の巻き込みです。

しかし、データ分析を担当するビジネスパーソンが、分析の現場から経営陣や他部署を巻き込んでいくためのポイントはなかなかまとまっていません。

最終回となる今回は、データ分析の8ステップのうち、Step7「巻き込み」で役に立つ4つのTipsをご紹介していきます。

データ分析の8ステップ

Tips1:ビジョンと成果で語れ

経営陣や他部署のメンバーの関心事は何でしょうか。

それは「高度な分析ができるか否か」ではなく、「成果につながるか否か」です。

データを扱う方々は、データを成果に、そしてその先のビジョンに接続する役割を担います

「自分たちはどんな世界を実現したいのか」というビジョンから逆算して、「このデータはビジョン達成のためにどんな成果をもたらすか」を語ることが、経営陣や他部署を巻き込む1つ目のポイントです。 

データ分析は、意識していても目的から外れていきやすいものです。分析に必要なデータが集まらなかったり、予想していたものとは異なる分析結果が出たりして、いつのまにかビジョンや目的を見失い頓挫してしまった、という話はよく聞きます。 

このように、「分析をすること」自体が目的化して失敗に陥る事態を防ぐためにも、データをビジョンと成果で語り、組織に横串を通していくことが重要です。

Tips2:まず成功体験を作れ

組織を巻き込む一番の近道は、「データにもとづいてアクションをしたら成果が生まれた」という成功体験をしてもらうことです。

なので、まずは小さな成功を生み出せるプロジェクトで成果を作り、組織に成功体験をもたらすことを目指しましょう。これが2つ目のポイントです。

データ分析は、必ずしも巨額のコストがかかるものではありません。収集や分析にコストがかからないデータでも、小さな成功を収めるには十分なケースが多いです。

小さな成功を重ね、データ分析の効果を組織全体が実感できるようになると、しだいに組織内でデータの重要性が高まってきます。データにもとづき意思決定をするデータドリブンな組織風土の醸成は、こうした小さな一歩からはじまります。

データドリブンな組織文化ができれば、データを事業成果につなげることが当たり前になるでしょう。

Tips3:視覚に訴えろ

データ分析の結果をまとめたレポートには、見慣れない数式や複雑なグラフ……そのまま見せても「なんか難しそう」と思われ、拒否反応を示されてしまうケースも。

こんなときはビジュアルを活用しましょう。データになじみがない人でも分かるよう、誰でも一目で分かるように見せる工夫ができます。 

一つ、簡単な例を見てみましょう。下の図の左側にある2つのグラフは、それぞれ「テレビCMの出稿量」「バナー広告のインプレッション数」を表したものです。これらを見て相関関係を見出せと言われても、なかなか難しいのではないでしょうか。

では、右側のグラフを見てみましょう。こちらは、「テレビCMの出稿量」「バナー広告のインプレッション数」「コンバージョン数」を表す3つのグラフを重ねたものです。波形を比べてみると、バナー広告よりもテレビCMのほうがコンバージョンと連動していることが一目で分かります。 

このように、いくつかのグラフはバラバラに見せるのではなく、波形と波形を重ね合わせて見せることで、分析に詳しくない方にも分かりやすく伝えることができます。これが3つ目のポイントです。 

グラフを重ねることで、伝えたいことをわかりやすく見せる例

Tips4:データで工夫せよ

分析の前提には「データ収集」があります。ですが、これからデータ分析を始めようというタイミングで必要なデータが完璧に揃っていることはなかなかありません。また、データ収集の段階で組織の協力は必要不可欠ですが、まだ成果が出ていない段階でデータ収集に協力を仰ぐことが難しい場合もあるのではないでしょうか。

そんな時は、Tips2に挙げた小さな成功を目指し、「今あるデータ」を工夫して使い、分析を行う努力も必要です。

ほしいデータが集まらないときや、必要なサンプル数に満たないとき──そんなときは、代わりになるデータがないか、少ない数でも分析できないかを考えてみましょう。 

「このデータじゃないとだめ」「●●サンプル以上ないとだめ」と思っていたけれど、実は別のデータでも、数が少なくても、大きな誤差なく分析できる場合があります。完璧なデータが揃っていなくてもデータ分析はできるのです。 

(e.g)ほしいデータが集まらないときに、別のデータを使う例

「ある地域の、日別の人の移動推移」を示すデータがほしい場合、GPSデータを集めて測定したり、実際に現地に人を派遣して測定したりする方法が考えられます。しかしこれらの方法を使うには大きなコストがかかります。

この場合、検索ボリュームとその推移をチェックする無料ツール「グーグルトレンド」のデータで代用できます。検索ボリュームから、おおよその日別の人口推移を推計できるからです(*1)。こうすれば簡単に必要なデータを集められ、大幅なコスト削減になるでしょう。

(*1)訪問先からの移動手段や経路、時間などを検索する人が多いだろうという仮定にもとづき、グーグルトレンドのトップページで「〇〇(地域名)から」と入力して検索する。

例えば下のグラフは、「渋谷駅から」と検索した結果。2020年1月15日に国内で最初のCOVID-19感染者が確認された後、東京都内で大きな流行がみられた2020年3月下旬〜5月下旬、特に、1回目の緊急事態宣言が発出された2020年4月7日〜5月25日の期間は、検索数が大きく減少する一方、緊急事態宣言と重点措置が全面解除された2021年9月頃からは検索数の上昇がみられる。このことから、検索ボリュームと人口流入数に相関があることが確認でき、人口流入数を推計できる。

グーグルトレンドを活用し、検索ボリュームからおおよその人口流入を推計する例

Point)代替データを使うとき/少ないサンプル数で分析するときの注意点

どんなデータでも無条件に代替できるわけではありません。代替データを使うときや、少ないサンプル数で分析する際は、事前に以下を確認するようにします。

◆ 代替データを使うとき

ほしいデータと代替データのあいだに相関があることの確認(上に挙げた例を参照)
・代替データに異常値がないかの確認

◆ 少ないサンプル数で分析するとき

・必要サンプル数と実際に集められるサンプル数の間で、どのくらい精度に違いがあるかを示す「標準誤差」という数値の確認
※ 標準誤差の数値が小さければ精度が高く、大きければ精度が低いということになります。標準誤差はエクセルの数式を使って算出することができますが、少し専門的な話になるので、詳細は別の機会にご説明したいと思います。

おわりに  

3回にわたり、データ分析の基礎知識をご紹介してきました。

3回とおしてお伝えしてきたのは、データ分析は事業成果につなげてこそ意味があるということ。そして、データ分析は、基本をおさえれば誰もが取り組めるものだということです。

「データ分析は専門家でないとできない」「完璧なデータがないとできない」と思っている方がいるかもしれませんが、実はそんなことはありません。できるところからぜひ実践していただきたいと思います。 

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」
【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

データ分析をゼロから学びたい人におすすめの書籍2選 

木田浩理・伊藤豪・高階勇人・山田紘史(2020)『データ分析人材になる。目指すは「ビジネストランスレーター」』日経BP 
三井住友海上でDXを推進するデータサイエンティストの方々による著書。企業でデータ分析を担当する人が押さえておくべき重要な考え方が「5Dフレームワーク」という方法論で解説されています。ビジネスの現場に寄り添って書かれているので、データ分析担当者だけでなく、マネジメント層や経営層にもおすすめしたい一冊です。 

河本薫(2017)『最強のデータ分析組織 なぜ大阪ガスは成功したのか』日経BP 
「データサイエンティスト・オブ・ザ・イヤー」の初代受賞者である、大阪ガスの河本薫氏が、データ分析組織の立ち上げから今日に至るまで、どのように壁を乗り越えてきたかを紹介しています。組織の作り方や巻き込みについてヒントがもらえるはずです。 

※Amazon商品ページのリンクを掲載しています

株式会社サイカ
ADVA Analysis部部長 西 津平

九州大学大学院工学府修了。大学院時代、原子力発電に関わる実験を通してデータ分析と統計学を学び、新卒から3年間、遊技機メーカーにて市場動向のデータ分析業務に従事。業界にとらわれずもっと広い範囲でデータ分析ができる環境を求め、2018年10月、サイカ入社。現在ADVA Analysis部の部長を務める。

データドリブンな企業への変革の鍵は、経営者とデータプロフェッショナル人材のコミュニケーション

データにもとづいてビジネスの意思決定を行う、データドリブンな企業への変革をどう進めればよいのか。多くの企業では、いまだ十分にデータドリブンな経営が行われていない。データの活用が進まない時、その背景には、経営者とデータプロフェッショナル人材のコミュニケーションの課題があることが多い。

2021年10月、プライベートエクイティ・ファンドを運営するD Capital株式会社にジョインした松谷恵氏は、航空機の安全性向上や金融デリバティブ商品のトレーディング、ファッションのECなどの現場で、膨大なデータをもとにビジネス課題を解決するデータサイエンスに一貫して取り組んできた。その松谷氏に、日本企業がデータサイエンスを実践するにあたり、企業の経営者が向き合うべき課題と、解決のために必要な取り組みを聞いた。

D Capital株式会社_松谷 恵(まつたに・めぐみ)氏

D Capital株式会社 パートナー
松谷 恵(まつたに・めぐみ)氏

東京大学工学部航空宇宙工学科卒業。マサチューセッツ工科大学航空宇宙工学科博士課程修了。NASAラングレー研究所等での航空機制御理論研究を経て、米投資銀行(東京・NY)にてクオンツストラテジストとしてトレーディングの自動化に関する研究開発に従事。その後、ファッションEコマースプラットフォーム運営会社にてCSOとしてAI研究開発及びデータ戦略を推進。イェール大学との共同研究で開発した「社会的意思決定アルゴリズムのオープンソース開発&実装基盤」が、内閣府主催の日本オープンイノベーション大賞で内閣総理大臣賞を受賞。2021年10月、パートナーとしてD Capital株式会社にジョイン。

データサイエンスの浸透には、経営者の技術リテラシーが必要

データサイエンスが注目されるようになって久しいですが、日本企業のデータサイエンスの実態をどうご覧になっていますか。

データサイエンスは、経営のみならず財務や人事、マーケティングや営業など、あらゆる領域で活用できる強力なツールです。日本でも、広告やECなどアクセスできるデータ量がもとから大きいセクターや、製造業のように技術が根幹となっているセクターでは比較的導入が進んでいます。ですが、北米企業に比べるといまだ浸透には遠いと感じています。

日本でデータサイエンスの浸透が遅れている要因の一つに、経営者の技術リテラシーがいまだ十分でないことが挙げられます北米の場合、学生時代に歴史や文化を学ぶのと同じように、コンピュータサイエンスを教養として学ぶことが一般的になりつつあります。

しかし日本の場合は、大学入試時に理系・文系の割り振りがあることも影響しているのでしょう。例えば、一度自分を文系だと認識すると、理系科目の知識に関しての取り組みを控えてしまう傾向があります。多くの場合において、コミュニティや考え方自体が、理系と文系、ビジネスパーソンとエンジニアのように、いまだ分断されています。コミュニケーション自体が断絶してしまっているのです。こうした状況が、ビジネスパーソンとエンジニア、アカデミア間で知見交流を行う機会の圧倒的な少なさにつながっています。

また、北米ではビジネスの競争がより一層激しいため、一部のオールドファッションな経営者は別として、「データを使わないと先はない」というプレッシャーを常に感じています。だからこそ、個人も企業もビジネス本来の領域に関係なく必死にキャッチアップをしようとしているのですが、地理的に独立している日本では、まだそこまで真に迫っていないのだと思います。

経営者はデータサイエンティストともっとコミュニケーションを

D Capital株式会社_松谷 恵(まつたに・めぐみ)氏

そうした現状を打破するために、経営者は何をすべきですか。

最も必要なのは、データサイエンティストに対してラベルを貼らないことです。話を聞いてもよく分からなそうだと決めつけず、コミュニケーションを直接取ること。これはお互いにとって、新しい発見や共にビジネス課題に取り組むための理解につながるはずです。

社内にはあらゆる領域のスペシャリストがいると思いますが、データサイエンティストもそうしたスペシャリストの一種です。サイエンスと聞くとアカデミックな印象を抱きがちですが、そもそもデータサイエンスとは、ビジネス課題の解決にデータをもって取り組むことを指します。課題に取り組む態度はサイエンスですが、その手法を学問と呼ぶのは、本来の意味と少し異なります。

同様に、データサイエンティストは学者というより、データ分析の手法を用いてビジネス課題に取り組むビジネスパーソンのことです。ですからまずは、社内のほかのスペシャリストに対するのと同じように、コミュニケーションを十分取ることが必須です。正しい課題設定は、経営者とデータサイエンティストのコミュニケーションの上に成り立ちます。正しい課題設定なしには、実際に何か分析を回しても意味がありません。

十分なコミュニケーションを取るほか、経営者自身がデータサイエンスの基本の考え方を学んだり、自分で体験してみたりすることも効果的です。

ここにも誤解があるのですが、データサイエンスの入り口は決して敷居の高いものではありません。かつて紙で書類を作っていた人たちが、今は当たり前にパソコンで書類を作成しているように、データサイエンスは実はとっつきやすく、データサイエンスの考え方は、現場と十分なコミュニケーションを取っているうちに自然と当たり前になるものだと思っていただきたいです。

昨今オンラインでもさまざまな講座が開設されていますし、スクールに通って学ぶこともできます。フレンドリーなUIを持つツールも豊富です。入り口として基本の考え方自体を知るにはこのようにいろいろな選択肢がありますし、データサイエンスをテーマにした書籍も専門書も、基礎知識に応じてさまざまあります。

経営者の意識の変化と同様に、データサイエンティスト側にも、コミュニケーションの活性化のためにできることがあります。

それは、モデル開発やデータ分析部分だけが自分の仕事だと、自ら制限してしまわないことです。それらは業務のほんの一部であり、「データをもって解決したいビジネス課題の設定自体も、データサイエンティストの重要な仕事だ」というマインドを持つべきです。データサイエンティストの仕事の半分以上は、課題設定が占めていると言っても過言ではありません。このことをデータサイエンティストは十分に自覚すべきですし、そうなっていないのであれば、取り組んでいる課題自体が適切かを問うべきです。

データドリブンな企業への変革は経営者次第

D Capital株式会社_松谷 恵(まつたに・めぐみ)氏

経営者がデータサイエンスを自らの意思決定に活かすため、データサイエンティストとのコミュニケーションを深めるほかに、取り組むべきことはありますか。

データサイエンティストと経営層のダイレクトなコミュニケーションが十分持てるような組織づくりも必要です。データドリブンな企業文化を醸成するためには、組織の変革と適切な人材の採用が欠かせません。

まず組織ですが、データ分析の結果、つまりデータサイエンティストの働きが、経営層の意思決定に反映できる組織になっているでしょうか。具体的には、経営層のすぐ下またはそれと同等な位置にデータサイエンス部門を配置しているでしょうか。このような組織になっていないとデータドリブン経営には取り組めません。変化を起こせるようなデータサイエンティストの採用は難しく、仮に採用できたとしてもその実力を発揮できません。

また、経営層に技術のバックグラウンドを持つ人がいるかというのも大きなポイントです。現場のデータサイエンティストにとってこれは重要なことです。技術の知見がありデータ利用の重要性を理解する人が経営層にいることは、データサイエンスのビジネスへ効果をより確かなものにします。

そして、日本企業ではまだまだ、どのような職務かではなくどの会社に入るのかが重視されるメンバーシップ型の採用が多く、データサイエンティストをはじめとしたスペシャリストがジョブ型で雇用され、適切な評価制度のもとで働ける組織が少ない状況です。この雇用の形がスペシャリストとしてキャリアパスを描きにくいという課題につながっています。このことも、北米企業と比較した場合の生産性の低さと人材の不足に影響していると感じています。

変革に向けて、まずはどこから着手するのがよさそうですか。

理想を掲げているだけでは動き出せないので、効果がありそう、かつ取りかかりやすい現場のオペレーションを探し出し、その部分の効率化または改善から始めるのがいいと思います。現状を必要な粒度の数字で把握できていない場合は、データを取得するところから始めます。データにもとづいて改善を図りそれが実現すれば、データが何をもたらすのかが経営層と現場の間で共有でき、さらに大きな課題に取り組む雰囲気が醸成されると思います。

企業文化の変革はすぐに達成できるものではありません。しかし、データドリブンな企業として生まれ変わるには徹底して取り組む必要があります。この徹底は、個々のマネジメントレベルだけでなく経営層が率先して取り組むべき課題です。

データにもとづく効率化が日本企業を強くする

データサイエンスを当たり前のように取り込んだ日本企業には、どのような未来が待っていますか。

企業にとって、もはやデータサイエンスはあればいいものではなく必要不可欠なものだと思います。他社が取り組みを進める中で足踏みしていては、取り残されてしまうのは目に見えています。

経営者は、すでに毎日何かしらのデータを見て意思決定に反映させているはずです。そうした意思決定の判断材料に、現場のオペレーションをより深く把握するデータを追加していくイメージです。知りたい問いに答えるための十分詳細なデータがないなら取得し、分析します。こうした試みの先でデータドリブンな意思決定が可能になります。

日本企業はクオリティもセンスも高いサービスや価値を提供しています。ここにデータにもとづく効率化を掛け合わせれば、競争力を高めることができますし、そうなっていってほしいと思います。

【後編】データ利活用第三の道「情報銀行」がもたらす、哲学とアイデア勝負の社会

2021年9月にデジタル庁が発足。2022年4月には改正個人情報保護法の施行を控える。日本のデータ利活用が大きく動き始めた。

GAFAやBAT(Baidu:バイドゥ、Alibaba:アリババ、Tencent:テンセント)が世界経済を席巻する中、これまで「データ後進国」と言われ続けてきた日本。そんな日本がパーソナルデータの保護と利活用を両立させる方策として打ち出したのが「情報銀行」だ。個人情報を特定の企業が独占するのでも、個人が自己責任で管理するのでもない“第三の道”として、世界から注目を集めている。情報銀行の普及によって、企業や個人が得られるメリットとは。その先に導かれる新しい社会像とは。

情報銀行のすべて』(ダイヤモンド社、2019年)の著者であり、株式会社NTTデータにてパーソナルデータ利活用分野を牽引する花谷昌弘氏に話を聞いた。


本記事は、前編・後編の二本立ててお届けします。(前編の記事はこちら

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長
花谷昌弘(はなたに・まさひろ)氏

1996年NTTデータ通信株式会社(当時)入社。2004年まで、主にシンガポール、マレーシアでの海外事業に携わる。09年より、マイナンバーに関する社内での新規ビジネス創発を主導。16年より、パーソナルデータビジネス、ブロックチェーンビジネスなどの新規ビジネス創発を主導し現在に至る。18年内閣府総合科学技術・イノベーション会議データ連携基盤サブワーキンググループ委員。My Data Global会員。

企業へのデータ提供は、回り回って消費者の利益になる

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

―情報銀行が普及・浸透すると、企業と個人はそれぞれどんな恩恵を享受することができるでしょうか。

まず、個人にとって最も大きなメリットは、企業とのコミュニケーションが効率化することではないでしょうか。

これまで、私たちはさまざまな商品・サービスについて、宣伝・広告を通じて知ることが多かったと思います。それゆえ、企業はできるだけ多くの人に知ってもらおうと、さまざまなメールや広告をこちらに投げかけてきます。

例えば、私の娘は来年成人式を迎えるので、振袖レンタルの広告が山のように届きます。すでに予約を済ませているにも関わらず、です。こうした企業の広告を煩わしく思う人も多いでしょうが、広告が届き続けるのは、私たちが私たちの情報を提供していないことが原因ともいえます。「すでに振袖レンタルの予約を済ませた」という情報さえ共有されていれば、無駄な広告は届かなくなるはずなのです。

無駄な広告にかかる印刷代や郵送代は、商品の価格に反映され、私たち消費者が負担することになります。つまり、「情報が流通しないと、消費者は損をする」といっても過言ではありません。

パーソナルデータが流通すれば、企業とのコミュニケーションはもっと効率的になるはずです。そうすれば、企業は商品やサービスなど、もっと本質的なものに投資できるようになり、私たち消費者はより良い商品・サービスを手にできるようになるかもしれません。直接的な効果ではないのでなかなか気づいてもらえないのですが、自分のデータを提供することは、回り回って消費者自身のためにもなるのだと、知っていただきたいですね。

企業にとっての最大のメリットは、アイデアで勝負できるようになることです。

これまでは、規模が大きく資本力がある企業ほどより多くのデータを持っているという状況がありました。データをベースにした宣伝・広告活動、データをベースにした商品・サービス開発は、より多くのデータを持つ企業、つまり大手企業が“勝ち組”になるケースが多かったのです。

一方で私は、ベンチャービジネスコンテストの審査員をさせていただく中で、素晴らしい事業アイデアを持つ地方の小さなベンチャー企業をいくつも見てきました。ところが、彼らはデータを持っていないために、仮説の検証ができなかったり開発に時間を要したりして、事業を断念せざるを得ない状況に陥ってしまうケースも少なくなかったのです。

もし、あらゆるデータがすべて情報銀行に集約され、企業規模にかかわらずあらゆる企業で活用できるようになったら。過去の実績は関係なく、「私(消費者)にとって魅力的な商品・サービスを考えてくれる企業」にデータが集まるようになったら。小さくとも優れたアイデアを持つ企業が、一気にトップランナーに躍り出ることができるようになるかもしれません。

情報銀行によって導かれるのは、都心にいなくても、巨大資本がなくても、歴史がなくても、アイデア一つでビジネスを成功させることができる世界。経済運営の中心が大企業から中小企業・ベンチャーへ、競争力の源泉が資本力からアイデア力へとシフトする、大きな変革が期待できます。

データ利活用を前進させるカギは、リテラシー向上よりも仕組みの整備にある

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

―パーソナルデータの流通・利活用を促進するには、消費者の中に「積極的に利活用しよう」という意識を醸成していくこと、また、データ利活用に関するリテラシーを高めることが求められそうです。情報銀行が社会実装されるにあたり、消費者にはどのようなリテラシーが求められるでしょうか。

個人のITリテラシーがより必要とされることは間違いありません。パーソナルデータを積極的に流通・利活用する世の中で、データを悪用しようとする者が出てくることは想像に難くないからです。こうした中、「自分のデータが、いま、どこで使われているのか」を把握し、データ提供の許諾にあたって「データを提供しても問題ない企業なのか」を見極める目を養わなければ、自らのデータが悪用され損害を被るリスクにさらされ続けることになります。

これについては個人の心がけに依存するのは難しく、消費者をサポートする仕組みづくりが必要でしょう。具体的には、データ提供を許諾した履歴や提供先企業の情報を蓄積し、必要に応じて閲覧できる場を用意することが考えられます。これも、情報銀行が担うべき機能かもしれません。

消費者をサポートする機能の一つとして、2020年にNTTデータが、企業のWebサイトのキャンペーンなどにおける「個人情報取扱規約」の安全度を点数で評価する実証実験を行いました。実験の結果、ユーザーの約9割が「表示が同意にあたっての判断材料として役立った」と回答し、一定の手応えを感じたところです。

副次的な効果として、実験参加企業の前向きな取り組みを促せたということが挙げられます。低い点数のままではユーザーから許諾が得られないため、より高い点数になるよう、企業が自主的に内容を改善するのです。結果的にほとんどの企業が80~90点と高得点をマークするようになり、ユーザーにとって安心・安全な状況が自然とつくられていきました。

消費者一人ひとりのITリテラシー向上が不可欠なのは言うまでもありませんが、それは一朝一夕に達成できることではありません。究極的には、学校教育に組み込んでいく必要があるでしょう。すでに民間企業の中には、小学生を対象に独自のリテラシー教育プログラムを提供しているところもありますし、今後は国を挙げての取り組みも必要だと思います。

そうしたリテラシー教育を着実に進めつつ、企業や国が消費者をサポートする仕組みをスピーディに整えていくことが、現実的な道だと考えています。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

―消費者が自らのデータを提供しようという意欲を高めていくためには、「情報を提供することで便益を得られた」という実感を積み重ねていくことも重要だと思います。その実感は、誰がどのように与えることができそうでしょうか。

2018年に情報銀行認定制度が開始され、すでに7社が情報銀行関連事業に取り組んでいます。今は、実績をつくっていく段階にきていると思います。

パーソナルデータ利活用による成果、特に消費者にとっての便益をいち早く提供することができそうな分野として有力視されているのは「ヘルスケア」と「ファイナンス」です。この2分野で、何か一つでもキラーアプリケーションが生まれれば、それが起爆剤となってパーソナルデータ利活用の気運が一気に高まるのではないかと期待しています。

情報銀行認定事業者一覧

一般社団法人日本IT団体連盟 情報銀行推進委員会 情報銀行認定事業者一覧(2021年10月現在)

出典:一般社団法人日本IT団体連盟 情報銀行推進委員会
情報銀行認定事業者一覧(2021年10月現在)https://www.tpdms.jp/certified/

企業は、哲学とアイデアで勝負する時代へ

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

―著書『情報銀行のすべて』で、個人がビジネスや社会の中心になる時代が来ると指摘されています。“情報銀行時代”において、個人⇔企業間の関係では、個人が主導権を握ることになるのでしょうか。

そのように考え、これからの時代における情報銀行の必要性を再認識しています。

コロナ禍によって、期せずしてリモートワークが浸透し、「通勤しなくてもいい」「都会にいなくてもいい」という社会の新常識が急速に広まることになりました。これまで通勤に使っていた時間を別のことに充てられるようになったことで、自分のスキルを活かして副業・兼業する人が増え、働き方はこれまで以上に自由になっていくと予想しています。

そうすると、個人と企業の関係性は必ずしも「企業に所属する」のではなく、「自分のノウハウを必要としている複数の企業で働く」スタイルがより一般的になっていくと思います。

個人のスキルやノウハウが、情報銀行を通じて流通する社会では、そうした働き方をより実現しやすくなるでしょう。

もちろん、全国民がそのような働き方にシフトするとは思いません。しかし、希望する人が、より自由な働き方を選択するためにも、情報銀行を通じたパーソナルデータの流通は有効だと考えています。

―個が強くなる時代、顧客や従業員から選ばれるために、企業はどうするべきでしょうか。

「コストパフォーマンスが良い」「品質が良い」「利便性が高い」「給与・待遇が良い」「〇〇社でしかできない仕事がある」といった要素も、もちろんこれまでどおり重要です。

しかし、今後はそうした要素以上に、その企業が「どのような哲学を持っているか」が重視されるようになると考えています。

なぜなら、個人がパーソナルデータを提供するかどうかを判断するときに、「社会に役立つかどうか」を重要な基準として考えるようになると思うからです。「新薬やワクチンを開発するためなら、私の健康データを提供します」「CO2排出量削減につながるのなら、私の購買データを提出します」といった具合に、共感できる哲学を持っている企業を応援したいという価値観は、今後より強まっていくはずです。

“情報銀行時代”の企業には、社会をより良くするために自社ができること・すべきことを改めて見つめ直した上で、明確な哲学を持ち、それを発信していくことが求められるといえるでしょう。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

―情報銀行が実装された社会では、企業が取得できるデータの量や種類にはほとんど差がなくなると思います。これからの時代、企業が「データで差別化する」のは難しいのでしょうか。

「データ利活用が、企業の競争力の源泉になる」こと自体は変わらないと思います。なぜなら、取得できる情報の量や種類は同じでも、それをどう分析・解釈するか、また解釈したことをどうアウトプット(商品・サービスやコミュニケーション)に落とし込むかは、依然として企業のアイデアにかかっているからです。

誰もが平等にデータにアクセスできるようになる“情報銀行時代”においては、データを「いかに使うか」がより一層重要になります。言い換えれば、いかに優れたアイデアを持っているかがカギになるということです。

大企業も中小企業も、歴史のある企業もそうでない企業も、都心にある企業も地域にある企業も、同じ土俵に立って闘えるフェアな社会。アイデアを武器に勝負できる社会。情報銀行の浸透とともに、そうした社会が実現されることを願っています。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

[インタビュー・文]齋藤千明
[撮影]小池大介
[企画・編集]川畑夕子(XICA)


<関連記事>
パーソナルデータの利活用や情報銀行への理解をより深めたい方は、以下の記事もぜひごご覧ください。
※株式会社NTTデータが運営する、金融×デジタルを通して金融と世の中の未来をつくるメディア「オクトノットの記事に遷移します。

【前編】データ利活用第三の道「情報銀行」がもたらす、哲学とアイデア勝負の社会

日本のデータ利活用が大きく動き始めた。2021年9月にデジタル庁が発足。2022年4月には改正個人情報保護法の施行を控える。

GAFAやBAT(Baidu:バイドゥ、Alibaba:アリババ、Tencent:テンセント)が世界経済を席巻する中、これまで「データ後進国」と言われ続けてきた日本。そんな日本がパーソナルデータの保護と利活用を両立させる方策として打ち出したのが「情報銀行」だ。個人情報を特定の企業が独占するのでも、個人が自己責任で管理するのでもない“第三の道”として、世界から注目を集めている。情報銀行の普及によって、企業や個人が得られるメリットとは。その先に導かれる新しい社会像とは。

情報銀行のすべて』(ダイヤモンド社、2019年)の著者であり、株式会社NTTデータにてパーソナルデータ利活用分野を牽引する花谷昌弘氏に話を聞いた。


本記事は、前編・後編の二本立ててお届けします。(後編の記事はこちら

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長
花谷昌弘(はなたに・まさひろ)氏

1996年NTTデータ通信株式会社(当時)入社。2004年まで、主にシンガポール、マレーシアでの海外事業に携わる。09年より、マイナンバーに関する社内での新規ビジネス創発を主導。16年より、パーソナルデータビジネス、ブロックチェーンビジネスなどの新規ビジネス創発を主導し現在に至る。18年内閣府総合科学技術・イノベーション会議データ連携基盤サブワーキンググループ委員。My Data Global会員。

情報銀行は、“データ後進国・日本”の革新的な一手

パーソナルデータ利活用の話題になると、“データ後進国・日本”という言葉が枕詞のようについて回ります。やはり日本はパーソナルデータ利活用の分野において「遅れている」のでしょうか。

遅れている点が多々あるのは事実ですが、実は遅れていない点もあります。2つの側面からそれぞれお話ししましょう。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

まず、「遅れている」面について。

2011年1月に、世界経済フォーラムが「パーソナルデータは第二の石油である」と発表する(*1)と、多くの国や企業がパーソナルデータを活用したビジネスへと動き始めました。最初に動いたのがGAFAであり、その後に続いたのがBATです。私たちは、彼らが構築した「特定の企業がパーソナルデータを大量に収集・活用する」エコシステムに知らず知らずのうちに組み込まれ、その結果、生活は格段に便利になりました。

その流れに対し、米国の巨大プラットフォーマーたちに自分たちのデータが吸い上げられる状況に異議を唱えたのが欧州。個人情報は個人のものであり、特定の企業ではなく個人が管理すべきだと主張しました。

特定の企業が大量のパーソナルデータを保有する米国・中国と、個人が自分のパーソナルデータを管理する欧州。近年、パーソナルデータを取り巻く議論には、この2つの大きな潮流が存在しています。日本は、こうした個人情報の取り扱いに関する流れにおいて、完全に遅れをとっていると言わざるを得ません。

パーソナルデータの「保護」のみならず「利活用」の面でも日本企業は遅れています。「データを利活用するのは重要なことである」という考え方がようやく浸透してきたところです。重要とわかっていても、自社にどんなデータがどれだけ存在するのかわからない。データを使って何ができるかわからない。多くの日本企業が、そうした状態から前に進めていないのが現状です。

一方で「遅れていない」面とは何か。

それが今回のメインテーマである「情報銀行」です。
情報銀行とは、パーソナルデータをお金のように「預託」して運用を任せ、その代わりに「便益」を得る、日本発の個人情報預託の仕組みです。

情報銀行は、一般社団法人 日本IT団体連盟が、総務省が策定したガイドラインにもとづいて認定を行い、国が定めた方針にもとづいて、民間企業が運営します。データを一社で独占するのではなく、「個人からパーソナルデータを預かり、必要に応じて企業に提供する」という、仲介役を担う点が特徴です。

一つの企業が大量のパーソナルデータを保有する米国・中国と、個人が自分のパーソナルデータを管理する欧州。情報銀行は、その“いいとこ取り”をしたものといえます。世界的にも、パーソナルデータ利活用の「第三の道」として非常に関心が高く、各国からさまざまな問い合わせを受けたり、同様の業態が米国・英国でも構想されつつあったりします。情報銀行の構想、そして実装に向けた動きについては、日本が先陣を切っているといえるでしょう。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

日本が、情報銀行という「第三の道」をとるに至った理由をどのように考えますか。

「諸外国に負けないよう、自国のデータは自国で管理・利活用すべきだ」という意見の方も多いのですが、私の考えは少し異なります。私が情報銀行を考えるときの起点となっているのは、「少子高齢化が進む中、地域の元気がどんどん失われてきている」という現状です。

例えば、私が中学生時代を過ごした岐阜県岐阜市では、毎日の通学に使っていた市営バスが最近になって廃業してしまいました。幸い、民間企業が路線を買い取り運行は続けられていますが、もし買い取ってもらえなければ、その地域は交通手段を完全に失っていました。

この状況を見て、私は「こういうことが起こるのは、今ある資源が効率的に使われていないからではないか?」と問題意識を持ちました。街がさまざまな変化を遂げても、バスの運行ルートや停留所の数・場所といったものはなかなか改定されません。「新しくショッピングセンターができたから、利用者を増やすためにバスのルートを見直そう」といった改善を、データにもとづいてスピーディに行うことができれば、バス路線という今ある資源を最大限に有効に活用して、住みよい暮らしを継続できるのではないかと思ったのです。

もう一つ例を挙げてみましょう。山間部に住んでいて、街中の病院に通院しているAさんがいるとします。もし、「Aさんは毎週木曜日の午前中に通院している」という情報が何らかの形で共有されていれば、山間部に荷物を届けに来た宅配便のトラックが、Aさんをピックアップして病院に連れて行くことができるかもしれません。

こういうことが実現できたら、非常に効率的だと思いませんか? 荷物を届け終わった宅配便のトラックの空きスペースが、Aさんを病院に送り届ける運賃に変わる。Aさんと運送会社、どちらにとってもメリットがあります。

少子高齢社会において、今ある幸福度や経済レベルを維持するには、このようにデータをうまく活用していく必要があります。諸外国と闘うためではなく、生活をより豊かにするためにパーソナルデータ利活用を促進するのが、情報銀行だと考えています。

(*1)総務省「平成26年版 情報通信白書」(2014年)
https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h26/html/nc133000.html

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

情報銀行の要諦は、個人情報の「預託」ではなく「運用」

パーソナルデータを有効に利活用することで、社会を全体最適化し、企業と個人がWIN-WINになる世界。それは欧州で運用されているパーソナルデータストア(*2)でも実現できるように思えますが、パーソナルデータストアと情報銀行は何が違うのでしょうか。

パーソナルデータストアと情報銀行の違いは、預かったデータを提供する相手を審査する機能の有無です。

これはまさに、金融の世界で銀行が行っているのと同じことで、銀行が融資する際には、融資先企業について「反社会的勢力とのつながりがないか」「倒産のリスクがないか」など、さまざまな観点からチェックを行います。「データ提供先の企業は問題のない相手なのだろうか? 紛失・悪用の恐れはないだろうか?」─パーソナルデータの流通・利活用における私たちの心配事の一つを解消するのが、情報銀行の審査機能です。

この機能が、パーソナルデータストアには実装されていません。パーソナルデータストアは、銀行に例えると「貸金庫」。データを預かるための安全な場所を提供するという極めてシンプルなものです。データを貯めるのも、引き出すのも、運用するのも、本人の自己責任。「個人中心」の価値観を背景とした、欧州らしい仕組みと言えます。

これによって欧州が現在直面しているのが、データの利活用が思うように進まないという問題です。「せっかく安全なところに預けているので、わざわざ外に出すのは避けたい」という意識が働いているのです。パーソナルデータの流通・利活用に対する日本人の心理的ハードルは非常に高いものの、仕組み・制度は欧州よりもはるかに安心・安全なものを用意できており、データが流れやすい環境が構築されつつあると思います。

(*2)パーソナルデータストア : これまで企業等に管理されていた自分の情報(名前、住所などの属性情報から、いつ何を買ったかという購買情報などの企業側で管理していた情報まですべて)を企業等から取り戻し、自らが蓄積・管理するために必要となるパーソナルデータの保管場所。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

情報銀行は、パーソナルデータを預かるだけでなく「運用」も担う構想があるようですね。

お金に関しては、「私たちから預かったお金を、銀行がプロフェッショナルの目線で融資・運用して増やし、私たちに還元する」ということが、当たり前のように行われています。現在認定されている情報銀行で、「運用」に着手している企業はまだありませんが、同様のサポートを情報銀行が行うことは十分に考えられますし、実際に認定事業者の中には、運用を含めたビジネスプランを策定しているところもあると思います。

お金の場合と異なるのは、情報は運用(企業への提供)の際に必ず本人の許諾が必要という点だけです。

極めて個人的な例なのですが、私はここ10年ほど尿酸値が非常に高く、いつ痛風を発症してもおかしくない状況なのですが、幸いにして健康そのものの生活を送っています。例えば、私のような人のデータが情報銀行に預けられていた場合、情報銀行は私に「あなたのデータはとても希少ですので、製薬会社Aに提供してはいかがですか? あなたのデータをもとに、より優れた痛風の薬を開発できるかもしれません」というオファーを出します。私が許諾すれば、製薬会社Aが希少なデータに対価を支払い、その一部が私に還元されます。これが、情報銀行が行うデータの「運用」の一例です。

株式会社NTTデータ 金融事業推進部 デジタル戦略推進部部長・花谷昌弘氏

データの提供先を審査したり、データの運用をサポートしたり、情報銀行は、リテラシーがあまり高くない人でもパーソナルデータを利活用しやすい仕組みのように感じます。

総務省・経済産業省がこのコンセプトを打ち出すにあたっては、まさにそのような配慮もあったと思います。個人が多くのリスクを背負わなければならない欧州型のパーソナルデータストアは、日本の消費者にとってはかなりシビアな仕組みです。

日本の金融市場を見ても、投資信託や貯金など、多くの人が資産運用を第三者に委託している状況です。そうした背景も踏まえて、仲介役のプレイヤーがサポートする仕組み、つまり情報銀行という情報信託の仕組みが考えられたのではないかと想像します。(後編に続く

[インタビュー・文]齋藤千明
[撮影]小池大介
[企画・編集]川畑夕子(XICA)


<関連記事>
パーソナルデータの利活用や情報銀行への理解をより深めたい方は、以下の記事もぜひごご覧ください。
※株式会社NTTデータが運営する、金融×デジタルを通して金融と世の中の未来をつくるメディア「オクトノット」の記事に遷移します。

中学・高校でも必修化の流れ? データサイエンスは、未来社会を生きるための基礎教養

「VUCA時代」とも呼ばれる、変化が激しく先行き不透明な現代。そのような状況下で求められるのが、未来の社会をつくり上げることができる人材だ。このような人材になるためには何が必要なのか。

この問題に教育の現場で向き合っているのが、数学者であり、慶應義塾大学総合政策学部の学部長も務めた河添建氏だ。河添氏は現在、東京女子学園中学校・高等学校の校長として、多様な課題に向き合い、多角的な視点で考え、解決策を導き出し、リーダーシップをもって具現化していく──これを成し遂げる人材の育成を目指し、さまざまな教育改革に取り組んでいる。2020年には、データサイエンスを取り入れた新カリキュラムをスタートさせた。なぜ、中学校・高等学校教育にデータサイエンスが必要なのか。データサイエンス教育は、未来の日本社会をどう変え得るのか。同校の教育改革を最前線で推進する河添氏に聞く。

東京女子学園中学・高等学校校長・河添健氏

東京女子学園中学校・高等学校理事・校長
河添 健(かわぞえ・たけし)
慶應義塾大学名誉教授。慶應義塾大学大学院工学研究科博士課程修了。理学博士。慶應義塾大学工学部専任講師を経て、2000年から総合政策学部教授、11~13年慶應義塾湘南藤沢中等部・高等部長、13~19年総合政策学部長。20年4月から現職。専門は調和解析。

データサイエンス教育で、日本が“滅びる”のを食い止める

―東京女子学園では、2020年にデータサイエンスを中学校・高等学校の必修科目にし、独自のカリキュラムを展開しています。他校に先駆け、この新しい試みに至った経緯を教えてください。

本校は、2020年に「Data Science, Design & Arts(DSDA)」と掲げて、新しい教育プログラムをスタートしました。 VUCA時代(Volatility,Uncertainty,Complexity,Ambiguity)とも呼ばれる、変化が激しく先行き不透明な現代。この時代を楽しく豊かに生きていくために必要な力として、本校では下図の5つを定義しています。

 VUCA時代を生き抜くための5つの力

出典:https://www.tokyo-joshi.ac.jp/10834/

このうち、データサイエンスでは、データや数字を通して事象を考える力を。デザイン・アートでは、見えなかったものが見えてくる視座を。多様な課題に向き合い、多角的な視点で解決策を考えることが求められる時代に必要な「見えないものを見る力」「出せない答えを出す力」を身につけてもらうため、DSDAはスタートしました。

次世代社会を牽引するグローバル人材を教育する方法として「STEM教育」「STEAM教育」(*1)が注目されてきましたが、これらはどちらかというと理系向けの教育プラン。DSDAはこれをもっと広げ、データサイエンスを軸に文理融合した教育プログラムとなっています。中学・高校の6年間をかけて、データサイエンスのリテラシーを身につけます。

(*1)STEM教育とは、科学、技術、工学、数学(Science, Technology, Engineering, Mathematics)の分野を統合的に学び、将来、科学技術の発展に寄与できる人材を育てることを目的とした教育プラン。STEAM教育は、これに芸術(Art)を加えたもの。

きっかけは、2020年4月に慶應義塾大学総合政策学部長を定年退職するのに先立ち、本校の理事長とお会いしたときのことです。中学校の入学者数が減少の一途を辿り、近年は定員を大きく下回るようになっていた東京女子学園は、改革の必要に迫られていました。

そこで、私がかねてから持っていた教育に関する問題意識も相まって、これまでにないまったく新しい教育プログラムをつくってはどうかと提案しました。日本が長年にわたって続けてきた教育の枠組みにとらわれず、日本の未来を変える人材を育てる教育。それがDSDAです。

東京女子学園中学・高等学校校長・河添健氏

―数学者であり、慶應義塾大学総合政策学部の学部長も務められた河添先生。今回のデータサイエンス教育の導入にあたっては、こうしたバックグラウンドやご経験も関係していたのでしょうか。

私は数学者の一人として、また教育者の一人として、日本のこれまでの数学教育は「失敗」だったと考えています。そして、一刻も早く旧来型の教育システムから脱却しなければ、遠くない未来に日本は滅びるとすら思っているのです。

世界でも他に例のない、“偏差値至上主義”ともいえる日本の教育。生徒の成績評価も、中学・高校・大学など学校に対する評価も、偏差値とそのランキングに依存しています。

偏差値そのものに問題があるというよりは、偏差値を上げることが目的化してしまい、自らの夢を育てたり、物事にチャレンジしたりする精神が育ちにくくなっているのが問題です。今の日本の若者の4割は夢を持っていないというデータ(*2)もあります。テストでいい点をとり、いい大学に行き、いい会社に就職する──無批判にそうした“王道”を追いかけ続けてきた結果、課題設定力や問題解決力に欠け、重要な意思決定ができない国になってしまったと感じています。

東京女子学園中学・高等学校校長・河添健氏

(*2)日本財団「18歳意識調査」(2019年)
https://www.nippon-foundation.or.jp/app/uploads/2019/11/wha_pro_eig_97.pdf
インド、インドネシア、韓国、ベトナム、中国、イギリス、アメリカ、ドイツ、日本の17~19歳それぞれ1000人を対象に、国や社会に対する意識を尋ねた。「将来の夢を持っている」という質問に対して、日本以外の8カ国では82.2%~97%という高い水準となった一方、日本は60.1%にとどまった。

また、偏差値偏重の教育システムの中で、文系/理系を分けてカリキュラムが組まれてきたこともマイナスに働いていると思います。文系を選択した人は数学を、理系を選択した人は国語や英語を極端にやらなくなる。いずれにしても、偏った知識・スキルだけが蓄積されていきます。

そして、失敗を恐れる風潮が、文理の分断をさらに深いものにしています。テストで悪い点数をとると「自分はこの分野は苦手なんだ」と思い込み、ますます遠ざけようとする。数学はこの傾向が顕著ですよね。偏差値偏重と文理分けに象徴される日本の教育が、“数学嫌い”を量産する結果を招いたと、私は考えています。

文理の分断は、日本にGAFAが誕生しないことの遠因にもなっていると思います。日本には優れた技術があるし、ビジネスのレベルも非常に高い。持っている知識の量や種類で言えば間違いなく世界有数の国です。しかし、多様な知識を横断的・総合的に組み合わせて、新しいもの・ことをつくり出すのが圧倒的に不得意です。文系だけでも理系だけでも、新しいものは生まれない。新しい価値は、文理融合によって生み出されている──それは世界でイノベーションを起こしている数多くの企業が証明しています。

そして、こうした状況を誰も正しいとは思っていないはずなのに、誰も変えられていない・変えようとしていないのが現状です。日本の未来を揺るがす問題の根源にある教育体系や社会構造を、いまこそ変えなければなりません。東京女子学園へのデータサイエンス教育の導入、DSDAの実践を通じて、そうはっきりと意思表示したいと考えています。

東京女子学園中学・高等学校校長・河添健氏

教えたいのは「教養としてのデータサイエンス」

―イノベーションを創出し、未来社会をつくる人材を育てるためには、文理融合の教育が不可欠。その新しい教育の柱として、データサイエンスを立てられたのですね。

先ほどもお話ししたとおり、日本人の“数学嫌い”には根強いものがあります。中高一貫の女子校で、理系教育が大事だからといって「数学をやりましょう!」と真正面からぶつかっていったところで、上手くはいきません。

そこで、デジタル時代・データ時代のこれからの社会を生きていく上で不可欠な要素であり、ビジネスをはじめとするさまざまな領域で今後もますます注目が高まっていくであろう、データサイエンスを軸とするのが良さそうだと考えました。 ただ、教員のほとんどはデータサイエンスに詳しくありませんから、初めは理解・協力を得るのに苦労しました。DSDAの開始に先立って、週次で行う教員会の場で毎回15~20分ほどレクチャーの時間を設けるなどして、教える側の体制整備を行いました。

東京女子学園中学・高等学校校長・河添健氏

―中学生・高校生向けのデータサイエンス教育とは、どんなものなのでしょうか。データサインティストを養成するような、専門的な知識も教えるのですか。

DSDAは、データサイエンスのスペシャリストを養成することを目的としていません。

教えるのは、教養としてのデータサイエンス。未来社会をとらえるための、ものの見方・考え方の枠組みを身につけることに主眼を置いています。

DSDAの名称が示すとおり、授業ではデータサイエンスだけでなく、デザイン・アートも扱います。データサイエンスとデザイン・アートの組み合わせに違和感を持たれる方もいるかもしれませんが、どちらも、さまざまな課題を解決したり、これまでにない新しいものを生み出したりする上で重要な感性という点で共通しています。

また「データサイエンス」や「統計」という言葉に、自分には縁遠いものと感じ、漠然と苦手意識を覚える人も多いでしょう。

ですから、DSDAでは“問題ありき”かつ体験重視のカリキュラムを設計しています。「世の中にこんな問題がある。どうやったら解けるだろうか?」と取り組む中で、知らず知らずのうちにデータサイエンスの本質に触れ、基本的な素養が身につく。そんなプログラムを用意しています。

国を挙げた支援を背景に、大学でもデータサイエンスを学ぶ学部・学科・コースを設置するところが徐々に増えてきています。「データサイエンスを学問・知識として教えることで、日本でもGAFAのような企業が生まれるのではないか」という発想です。私はこの流れを、やや懐疑的に見ています。偏差値偏重の枠組みのまま、知識詰め込み型のカリキュラムでデータサイエンスを教えたら、かつての数学がそうだったように、かえって“データサイエンス嫌い”を生み出すことにならないだろうかと。

データサイエンスは、オープンソースが基本の世界。スペシャリストを目指したい人に向けては、さまざまな場や機会が用意され、広く門戸が開かれています。有名どころで言うと、フランス発の学費無料のITエンジニア養成学校「42」や、2017年にGoogleが買収したデータ分析コンペプラットフォーム「Kaggle(*3)」など。学校教育で教えずとも、実践を通じていくらでも知識やスキルを習得することができます。

中学生・高校生、大学生、ビジネスパーソンと年齢を問わず、未来社会を生きる広く一般の人に必要なのは、データサイエンスのリテラシーなのです。

東京女子学園中学・高等学校校長・河添健氏

(*3)企業や研究者とデータサイエンティストを結びつけるプラットフォーム。統計学、情報科学、経済学、数学に精通しているデータサイエンティストが多数登録されており、企業や研究者が投稿した課題をデータ分析して、最適なモデルを導くために競い合う。Kaggleのシステムはコンペ方式を採用しており、参加者の提示したモデルは即時に採点され、順位が表示される。

―DSDAの具体的なカリキュラム内容を教えてください。

学習指導要領により定められた5教科(国語、社会、数学、理科、英語)の教科学習の時間以外に設けられた「探求学習」の時間に、DSDAを組み込んでいます。

東京女子学園中学・高等学校のDSDAプログラム一覧

出典:https://www.tokyo-joshi.ac.jp/junior/education/inquiry/

中学1年生では、コンピュータの仕組みを理解することから始まり、グラフを読み解く・グラフで表現するワークを通じて統計の基礎を学びます。中学2年生は「フェイクニュースにだまされない方法」など時流に沿ったテーマで情報リテラシーを学び、中学3年生は「3Dプリンターでものづくり」でデジタル・ファブリケーションを学びます。

高校生になると、「AIのキホンを学ぼう」でAIの仕組みを理解したり、「デザイン思考で我が家の改善」をテーマにデザイン思考のワークショップを行ったりします。近隣の企業・団体とコラボレーションしたプロジェクト学習も多く取り入れており、データサイエンスと社会のつながりを自然と感じられる内容になっています。

探求学習の時間だけでなく、国語・社会・数学・理科・英語や体育・芸術・家庭などの各教科学習の中にも、データサイエンスの視点を取り入れています。たとえば、家庭科の授業の一貫で、東京・練馬区に味噌蔵を構える糀屋三郎右衛門とコラボレーションした「味噌づくり」。一見データサイエンスとは関わりがなさそうですが、美味しい味噌をつくるには、実は温度・湿度といったさまざまなデータを活用することが欠かせません。 このように、中学・高校6年間の教科学習・探求学習の中で、さまざまな形で楽しみながら、データサイエンスの面白さや可能性を実感してもらいたいと思っています。

東京女子学園中学・高等学校校長・河添健氏

主体的かつ文理融合で考えるから、未来は面白い

―データサイエンス教育によって身につく能力について、あらためて教えてください。

繰り返しになりますが、本校のデータサイエンス教育によって身につくのは、データサイエンスの知識ではなくリテラシーです。

世の中に流通する情報量は爆発的に増え続けており、もはや飽和状態です。膨大な情報の中から適切なものを取捨選択し、それを読み解いて、課題解決につなげていくための基礎的な素養。デジタルテクノロジーやデータの利活用によって実現する、豊かで暮らしやすい社会「Society 5.0(*4)」を生きる上で必須の、ものの見方や考え方の枠組み。文理の別なく必要なこの力を、体得してもらいたいと考えています。

(*4)2016年、内閣府が「第5期科学技術基本計画」で提唱した概念。サイバー空間(仮想空間)とフィジカル空間(現実空間)を高度に融合させた「超スマート社会」を実現させるための一連の取り組みのこと。「経済発展」と「社会的課題の解決」が両立する人間中心の社会とも言われる。

それに加えてぜひ身につけてほしいのが、主体的に考える力です。

主体的に考える力とは、枠にこだわらずに多角的な視点で考え、正しい道を選択し、自立的・自律的に進んでいく力のことです。主体性がなければ、SF映画などで描かれるような「テクノロジーに支配される世の中」が現実のものとなってしまいかねません。

いまの若い世代を見ていると、社会に対して受け身で、決められた枠の中でそこそこ幸せに生きていければいいやと考えている人も少なくないように見受けられます。でも、そんな人生で果たして幸せでしょうか? 楽しいでしょうか? 未来の社会をより良く生きるために、自分は何をすべきなのか、自分はどうしたいのか。それを考え、実践するための基礎教養がDSDAです。

一人ひとりが主体的な社会とは、多様性を認める社会です。一人ひとりが主体的になるといろいろな意見が出てきますから、多様性を認めることが社会の基本ルールになります。その上で、多様な意見の中から本当にあるべき方向性を定めていくリーダーが、これからの時代に最も求められる人材です。しかし現時点では、主体的な意見がまだまだ少ない状態ですから、まずは主体的に考え動く人を増やすことから始めるのです。

データサイエンス教育が、古い慣習や旧態依然とした制度、固定観念にがんじがらめにされて、新しい価値をつくり出すことができない日本から脱却し、主体性で溢れた社会をつくるきっかけになればと願っています。

東京女子学園中学・高等学校校長・河添健氏

―世代を問わず、すべての現代人が身につけるべき教養。それがデータサイエンスの本質であると教えていただきました。ありがとうございました。

[インタビュー・文]齋藤千明
[撮影]小池大介
[企画・編集]川畑夕子(XICA)

【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

「データ分析の8ステップ」「覚えておくべき3つの分析手法」「組織の巻き込み方」の3本立てで、これまでデータ分析を学んだことがない方に向けて、データ分析の基礎知識を解説していく本連載。

第1回では、データ分析の8ステップを解説しました。
【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

分析の8ステップ

第2回となる今回は、このうちの「Step5:分析」に焦点をあて、ビジネスパーソンが覚えておいて損はない3つの分析手法を紹介します。

分析の8ステップ「Step5:分析」

ビジネスで使える、3つの分析手法

ビジネスパーソンがなぜデータ分析をするのか? と聞くと、
「売上に響いている要因を特定したい」
「投資の効果を定量化したい」
といった思いが背景にあることがほとんどだと思います。

これらはいずれも、売上とそれぞれの要因、 投資額とその効果というように「データとデータの結びつきの強さを数値化・可視化したい」という要望であると言い換えられます。

データ分析(統計分析)は、このようにデータとデータの結びつきの強さから影響度合いを数値化・可視化することを得意とします。

データ分析の手法は数多くありますが、今回は、ビジネスパーソンが覚えておいて損はない、比較的簡単な「クロス集計」「単回帰分析」「重回帰分析」の3つの分析手法について紹介していきます。

データ分析の基本「クロス集計」


仮説に合わせて、さまざまな切り口でデータを掛け合わせて分析する手法が「クロス集計」です。

クロス集計は、特別な統計知識も、難しい数式も、特殊な解析ソフトも必要なく、初心者の方でも明日から取り組んでいただける分析手法です。しかし、その分かりやすさとは裏腹に、データ分析の領域で「クロス集計を制する者がデータ分析を制す」という言葉があるほど重要な、データ分析の基本となる分析手法です。

(e.g.)アイスメーカーが女性向けキャンペーンの実施を決定。キャンペーンの対象商品を決めるためにデータ分析を試みた

キャンペーンの対象商品として候補に挙がっているバニラアイスとストロベリーアイスの売上データを比較してみると、バニラアイスがストロベリーアイスの2倍の売上を占めています。このデータだけを見たら、バニラアイスをキャンペーンの対象商品にしようと思うかもしれません。

商品ごとの売上データ

ですが、今回はターゲットを女性にしぼったキャンペーンです。そこで、性別ごとの売上データを見てみると、女性よりも男性のほうが購買数が多いことが分かります。

購入者の性別ごとの売上データ

そこで、購入者の性別ごとに売上データを見てみましょう。すると、バニラアイスの購入者の9割は男性で、一方のストロベリーアイスは、購入者の8割が女性でした。この結果を受け、 今回の女性向けキャンペーンの対象商品はストロベリーアイスに決定しました。

購入者の性別と商品の売上をかけ合わせてクロス集計

クロス集計はこのように、データをタグ(性別・年齢・嗜好など)で分類し、それらを掛け合わせて行う分析です。

1対1の関係性の強さを導き出す「単回帰分析」

 
“身長”と“体重”、 “最寄り駅からの距離”と“賃貸住宅の家賃”のように、仮説の時点で関係性が強いと予想される2つのデータの関係性の強さを導き出す分析手法が「単回帰分析」です。

一般的には、単回帰分析を行う前に、データとデータの相関の強さを表す「相関係数」を算出し、相関関係の有無を確認するところから始めます。相関係数はエクセルの標準数式を使って算出することができ、−1(完全な負の相関)から+1(完全な正の相関)の間の数値になります。

相関関係の有無を説明した図

相関関係の有無は、相関係数の数値によって以下のように判断します。

相関係数の判断基準

2つのデータの相関関係は、比例もしくは反比例の関係にあるので、分析のアウトプットとしては、「一方が大きくなるともう一方も大きくなる」「一方が大きくなると他方が小さくなる」「相関なし」のいずれかになります。

「相関」というのは単なる関係性の有無なので、2つのデータの間に原因→結果があるかないかは関係ありません。一方の「単回帰分析」は、片方のデータが1増えるともう片方のデータがどのくらい増えるかといった、2つのデータの原因と結果の関係を求めるものです。

2つのデータの相関の規則性を視覚的に確認するためには、「散布図」というグラフを使います。データが該当するところにプロット(打点)していき、これらの点の傾向を表す傾向線を引くと、線の傾きの大きさで、2つのデータの関係(xが1増えると、yはどのくらい増えるか)を可視化できます。

散布図のイメージ

また、2つのデータの関係を数値化したものを「回帰係数」といいます。

単回帰分析を説明する図

Point)単回帰分析は、売上予測には向かない

ビジネスの現場で、1つの要因と1つの成果のみが存在する状況はほとんどありません。たとえば、テレビCMがどのくらい売上に影響を与えたかを知りたいときに、テレビCMの出稿量と売上高のデータを使って単回帰分析をしても、精度の高い予測は見込めません。実際は、新聞広告やインターネット広告など、ほかの広告施策、立地や天候、値下げセールなど、さまざまな条件が売上に影響を与えているからです。売上予測には、次項で紹介する重回帰分析を使うことをおすすめします。

複数の要素の関係性を見出す「重回帰分析」


「重回帰分析」は「単回帰分析」と同じく、成果と要因の関係性を導き出す「回帰分析」の仲間です。単回帰分析が2つのデータの相関関係を探るのに対し、重回帰分析は3つ以上データの相関関係を導き出します

ビジネスの現場では、
「売上目標を達成するためには、広告宣伝費にいくらかけるべきか」
「施策Aと施策B、それぞれどのくらいの効果が見込めるか」
「今期の予算をどう配分すると、マーケティング成果を最大化できるか」
というように、複数の要因を統合的に分析した上でアクションを検討すべき場面が多くあります。

重回帰分析は、こういった売上予測やマーケティング戦略の策定などに活用できる、マーケティング分野では必須ともいえる分析手法。 成果に影響を与えていると予想される3つ以上の要因(=説明変数)を、成果(=目的変数)に掛け合わせ、それぞれの相関関係のあり・なし、関係性の強さ・弱さを導き出す分析です。

重回帰分析を説明する図

※ 標準化と標準化偏回帰係数:成果に影響を与えている要因(説明変数)は、それぞれ単位が違います。そこで、それぞれの変数を特定の値になるように調整します。このことを「標準化」といい、標準化によって求められる「標準化偏回帰係数」は、平均を0、分散を1で表し、数値間の大小で相対的に各変数の影響度合いを評価します。

(e.g.)マーケティング施策の最適な予算配分を検討するため、重回帰分析を行う

① 今回の分析で知りたいこと(何らかの施策を通じて増やしたい、もしくは減らしたいこと)を成果(目的変数)として設定します
例)最適な予算配分でマーケティング施策を実行し売上を上げたい場合は、「売上」を目的変数におきます

② 最終的な成果(目的変数)に影響を与えていそうな複数の要因(説明変数)を洗い出します(説明変数は10以内におさめます)

③ それぞれのデータを収集し、統計ソフトで分析します
※ エクセルのデータタブにある「回帰分析」ツールや、「JMP」や「SPSS」などの有料ソフトを使います

④ 算出された方程式(重回帰式といいます)に、計画している施策の予算を入れ、各施策の最適な予算を探ります

Point)重回帰分析は、説明変数同士で相関関係が強いものを入れてしまうとうまくいかない(多重共線性)

重回帰分析を行う際、分析精度を上げようと、たくさんの説明変数を入れてしまうことがあります。ですが、説明変数同士で相関関係の強いものがあると「多重共線性」という現象が起き、予測精度が低下します。多重共線性は、英語で「multicollinearity」ということから、略して「マルチコ」とも呼ばれます。

(e.g.)「コンビニの月間売上(成果)」に関係がありそうな要因として「月間の降水量」と「雨が降った日数」を説明変数に入れて重回帰分析を行った
→「月間の降水量」と「雨が降った日数」の相関関係が非常に高いため(雨が降った日数が多ければ月間降水量も増える)、多重共線性が発生する

<多重共線性が発生してしまった場合の回避方法 >

①相関関係が強い要因のうち、どちらか一方を外して再度分析する(どちらを外すか迷った場合は、仮説に沿って優先度の高い方を残す。または両方を一つずつ入れて分析してみる)
②変数同士の性質が同じ場合(たとえば、動画Aと動画Bを変数として入れたい場合など)は、両者を統合(足し算)した数値を使って分析する

まとめ

データ分析の代表的な手法を3つ紹介してきました。これらの手法を正しく活用するためには、どのような仮説を立てるかが重要です。本連載の第1回でデータ分析の一連の流れと仮説の立て方を解説しているので、そちらもぜひご覧ください。

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

データ分析をゼロから学びたい人におすすめの書籍2選

『やさしく学ぶ データ分析に必要な統計の教科書』羽山 博(著)
エクセルを活用した分析のやり方など、実践的なHOWTOを学べます。はじめてデータ分析に触れる方が、データ分析の基礎を学びたいと思ったときにおすすめの一冊です。

『統計学図鑑』栗原 伸一 ・丸山 敦史 (著)
教科書に載っているようなデータ分析手法を、噛み砕いて説明してくれています。図鑑という名のとおり絵や図が多いので、初心者でも理解しやすくなっています。分析手法の名前から逆引きもできるので、それぞれのデータ分析手法について詳しく学びたいときにもおすすめ。辞書のように手元に置いておきたい一冊です。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ
ADVA Analysis部部長 西 津平

九州大学大学院工学府修了。大学院時代、原子力発電に関わる実験を通してデータ分析と統計学を学び、新卒から3年間、遊技機メーカーにて市場動向のデータ分析業務に従事。業界にとらわれずもっと広い範囲でデータ分析ができる環境を求め、2018年10月、サイカ入社。現在ADVA Analysis部の部長を務める。

データサイエンスを活かすなら「データサイエンス」を学ぶな

データサイエンスの重要性はよくわかっていて、業務にも取り入れ始めている。しかし、なかなか成果につながらない──そんな悩みを抱える企業、マーケターは少なくない。

その原因の多くは、データサイエンスの目的や課題を適切に設定できていないことにある。それゆえに、適切なデータを適切な方法で分析できず、せっかくのデータ分析が実は無駄になっている可能性が高いのだ。

今回お話を伺ったのは、統計学・行動経済学・マーケティングの専門家で、国内トップレベルのデータサイエンティストとしても知られる、慶應義塾大学の星野崇宏教授。星野教授は、「ビジネスの現場で使えるデータサイエンスを身につけるには、まず経済学・経営学・マーケティングサイエンスといった『ビジネスサイエンス』を理解することが不可欠」と話す。

慶應義塾大学経済学部 教授 星野崇宏(ほしの・たかひろ)氏
2004年3月、東京大学大学院総合文化研究科博士課程修了。博士(学術)。博士(経済学)。情報・システム研究機構統計数理研究所、名古屋大学大学院経済学研究科などを経て、慶應義塾大学経済学部教授。シカゴ大学客員研究員、ノースウェスタン大学ケロッグ経営大学院客員研究員などを歴任。行動経済学会副会長。マーケティング・サイエンス学会理事。理化学研究所 AIPセンターにおいてAIを経済経営分野に活用するチームのチームリーダーを兼務。2017年、45歳未満の研究者に政府が授与する最も権威のある賞、日本学術振興会賞を受賞。ほかに日本統計学会研究業績賞など受賞多数。内閣官房や総務省、経産省、文科省の委員として政府のエビデンスに基づく政策意思決定の整備に関わるとともに、サイバーエージェント、マネーフォワード、ヤフー研究所などの技術顧問として学術的な技術提供を行う。さらに数多くの企業にマーケティングや人的リソース配分などの実務のコンサルティングを行い、2020年には経済学の学知に基づくコンサルティングを提供するエコノミクスデザイン社を坂井豊貴慶大教授や安田洋祐阪大准教授らと創業。

まず学ぶべきは「ビジネスサイエンス」

―星野先生が「データサイエンス」の道に進まれたきっかけはどんなことだったのでしょうか。

人々が「どのように意思決定を行っているのか」、そして「どのように意思決定を行うべきなのか」に強い関心がありました。

前者には心理学や行動経済学、後者には経済学や統計学、機械学習などが深く関わります。実は国内外に「データサイエンス」という学問分野はなく、私はこうした分野を横断して研究を進めてきました。

初めのうちは「個人」の意思決定に関心があったのですが、研究を進めるうちに、企業をはじめとする「組織」の意思決定への関心が高まっていきました。企業との共同研究の機会に多く恵まれたことも「組織」への意識を強める要因の一つになったと思います。

意思決定の主体は、政府、自治体、企業、個人と実に幅広いです。私は政府や自治体のEBPM(エビデンス・ベースト・ポリシー・メイキング:証拠に基づく政策立案)にも携わりたいと思っていたので、フィールドを限定することなく意思決定について研究できる場を求め、研究者の道に進みました。

―意思決定の手段の一つとして「データサイエンス」に注目する企業が増えています。しかし実際のビジネスの現場では、上手く活用できていないケースが多いようです。その原因についてどうお考えですか。

マネジメント側(経営者やマーケター)とデータサイエンティスト側、ともに「ビジネスサイエンス(本稿では、経済学・経営学・マーケティングサイエンスなど、ビジネスに深く関わる学問を指す)」の理解が圧倒的に足りないことが、データサイエンスがうまくいかない大きな原因だと考えます。つまり、データがどうこう以前の話なのです。

企業価値を高める・利益を上げるといった成果を得るために「どんな意思決定をすべきか」「何を最適化すべきか」──ビジネスサイエンスは、これを考える基盤となる学問で、ビジネスの現場に活かせる知見の宝庫です。海外では長年にわたって蓄積された膨大な研究成果があり、企業経営に積極的に活用されていますが、国内ではほぼ活かされていないのが現状です。

マネジメントがビジネスサイエンスの知見を活用できていないと、ビジネスの全体像を踏まえた目的・課題設定、施策の立案ができません。あらゆる施策が場当たり的になり、一向に成果につながらない状況に陥る可能性が高くなります。

このことは組織や戦略にも言えますが、ここではデータサイエンスが最適化しようとするKPIに限定して話をしたいと思います。

企業たるもの、スコープが短期か長期か、株主のためか従業員をより重視するか、社会への利益還元かの重みは企業ごとに違うにせよ、本来は(企業活動に関わる)ステークスホルダーの利益を最大化するべきものです。

利益の創出という観点で自社の課題を特定し、ブレイクダウンして具体的な施策に落とし込み、施策ごとにKPIを設定する。そのKPIの達成を通じて、利益の最適化を実現していく。これが本来あるべき姿なのに、多くの企業では “どこかの誰かが重要と言っていた”個別KPIの部門ごとの個別最適化がマネジメントによって放置され、利益最大化という最終目標の下でのコントロールができていません。結果として、いくらKPIを部分最適化する高度な分析を行っても、工数とコストばかりかかり利益が出ないという残念な結果になっています。

KPIはあくまで施策のモニタリングのマイルストーンでしかありません。もちろん個別のビジネスには依存するものの、原則としてどんな施策がどのように利益に貢献するかはビジネスサイエンスの膨大な知見が教えてくれます。まずはビジネスサイエンスの巨人の肩に乗るべきです。

一方のデータサイエンティスト側も、経済学・経営学・マーケティングサイエンスなどビジネスサイエンスの基礎すら学んでいない人が大多数と言わざるを得ません。

ビジネス上の成果を得るために必要な意思決定が何か。データ分析を行った結果としてどのような施策を行うことができるのか。さらにビジネスの全体像が理解できていないために、データ分析としては非常に高度なことをやっていても、ビジネスに資するアウトプットは生み出せていないケースをよく見聞きします。

「ビジネスの現場で使えるデータサイエンス」とは

―星野先生は「ビジネスの現場で使えるデータサイエンス」の重要性を提唱されていますね。

「ビジネスの現場で使えるデータサイエンス」とは、“成果を得るためにどんな意思決定をすべきか”から逆算して行われるデータサイエンスを指します。日本企業のビジネスの現場でデータサイエンスが上手くいっていない原因の裏返しですね。

膨大な先行知見のあるビジネスサイエンスの巨人の肩に乗り、正しい意思決定方法の定石を利用し、「何をどのような手段で最適化すべきか」という課題設定を適切に行うことが「使えるデータサイエンス」の第一歩であり、最も重要なポイントです。

データについて考えるのは、その次の段階です。設定した課題を解決するためにはどんなデータが必要か、企業の打ち手に紐づく形でどんな分析が適切かを考える。データサイエンスは、あくまで正しい意思決定をするための手段なのです。

マーケターが自らデータサイエンスの具体的な方法論を身につける必要はなく、むしろ専門家に任せたほうがいいのではないかと思います。それよりも、ビジネスサイエンスの考え方、定石を理解することのほうがずっと重要です。

―マーケターがデータサイエンスを身につけるなら、まず何から始めればいいでしょうか。

繰り返しになりますが、まずはビジネスサイエンスを学び、正しい意思決定と課題設定の方法を理解することが重要です。

それにもう一つ加えるとすれば、データを正しく解釈するために留意すべきバイアスを知ることが挙げられると思います。

入手できるデータには、実はさまざまなバイアスがかかっています。そのバイアスを考慮せず、目の前のデータだけを見て意思決定をすると問題が生じます。

たとえば消費財のテレビCMは、ビールなら夏、携帯電話なら春先といった具合に、売上が上がりそうな時期に大量に出稿するのが基本的な方針です。CM出稿量と売上を単純に並べると「テレビCMは売上に大きく貢献しており、ほかの広告は不要」なように見えるのですが、そもそも売上が上がりそうな時期に出稿しているので売上が上がるのは当然です。

こういった広告出稿のメカニズムを除去して考えたうえでも、もちろんテレビCMの効果は一定以上ありますが、単純な見た目ほどではなく、やはりテレビCM以外の様々なメディアを組み合わせる必要があることが分かります。売上に影響を与えると思っていた要因は実は他の要因によって決まっていた、という内生性バイアスや、売上の高い時期に出稿されていたから出稿量と売上の関係が見えてしまう、という逆因果などはビジネスサイエンスを学べば叩き込まれる概念です。

目の前のデータを鵜呑みにせず、どのようなバイアスがかかっているかを正しく把握し、実行しようとしている分析が誤った結論を導き出す危険がないかを冷静に見極めることが重要です。

より良い意思決定が「個」を活かす社会をつくる

―星野先生は、データサイエンスそのものの研究だけでなく、データサイエンス人材の育成にも力を入れていらっしゃいます。

企業との共同研究や顧問としてのコンサルティングを進めるなかで、先ほどお話ししたように「“どこかの誰かが重要と言っていたKPI”にとらわれて部分最適に終始している」状況を何度も目の当たりにしました。それをもどかしく思い、「日本企業の生産性を高めたい」という気持ちが次第に高まっていったことが、私が「使えるデータサイエンス」を提唱するに至ったきっかけです。

日本企業の生産性を高める上で、長期的な視点で重要なのが、ビジネスサイエンスも含めたデータサイエンス教育だと考えています。私一人でできることには限界がありますから、データサイエンスの知見・スキルを持つ学生を育ててビジネス現場に送り込み、それぞれデータ活用に取り組んでもらおうというわけです。

海外のビジネススクールは、研究者と実務家が共同研究を行う枠組みが整備されていますが、日本にはそういう場が非常に少ないのが現状です。アカデミアで十分に研究・実証されたビジネスに活かせる学知がたくさんあるにも関わらず、ほとんど活用されていないのは、そういった教育現場の課題が一因となっています。「学知はビジネスの現場では使えない」と思い込んでいる実務家も多く、非常にもったいないと思っています。

アカデミアにしても、それをやることが直接的な利益につながるわけではないので、つい“居心地の良い”アカデミアの領域に閉じこもってしまう傾向があります。私としては、今後もアカデミアと実務の融合を図り、ビジネスに学知を活かす機会と人材を増やしていきたいと考えています。

―データサイエンス人材が増え、データサイエンスが普及した先に、星野先生はどのような未来を思い描いていらっしゃいますか。

大きなゴールは、「個」が活かせる社会をつくることです。

一人ひとりの能力や感性、情熱を最大限に活かして、本質的な価値を創造する社会。それは、社会の生産性が高く、余裕がある状態でなければ実現できません。 そして生産性を高めるには、政府・自治体・企業・個人といったすべての主体の意思決定の質を高めていく必要があるのです。しがらみや慣習にとらわれず、サイエンスとデータに基づいて意思決定をするための環境(組織・人材・制度・文化)を整えていかなければなりません。

この20年、「生産性向上」の手段として、単純にやりやすいコストカットばかりが偏重されてきました。しかし先進諸国が行っている価値創造ができず、所得が相対的に下がり、日本の社会全体に余裕がなくなってしまったように思います。

ビジネスサイエンスとデータを用いた意思決定によって生産性を高め、人々が「個」を活かした本質的な価値創造に力を注ぐことができ、その価値が評価される社会をつくる。データサイエンスの社会実装を着実に進めていくべく、今後も取り組んでいきます。

[インタビュー・文]齋藤千明
[撮影]小池大介
[企画・編集]川畑夕子(XICA)

【ゼロから始めるデータ分析#1】初学者がまず知るべき「分析の8ステップ」

ビジネスにおいてデータ分析の重要性が増していることは周知の事実です。データドリブンな経営を志向し、すでに動き出している企業や組織も多いのではないでしょうか。

しかし、
「データ分析とは何なのか、実はよく分からない」
「貯まっているデータはあるが、目の前の課題との繋げ方が分からず活用できない」
「データ活用を意識しているつもりだが、思ったような成果が出せていない」
「自分は文系で、統計学や数学、プログラミングに詳しくないからデータ分析はできない」

と動き出せずにいるビジネスパーソンがいることも想像に難くありません。

ですが実際のところ、ビジネスでのデータ活用は、専門知識がなくてもできることが多いのです。

この連載は、「データ分析の8ステップ」「覚えておくべき3つの分析手法」「組織の巻き込み方」の3本立てになっています。

これまでデータ分析を学んだことがない方に向けて、ビジネスにおけるデータ分析の必要性と覚えておくべきデータ分析の基本をポイントを絞って解説し、データをビジネスの成果に繋げるヒントを紹介していきます。

ビジネスにデータ分析が必要な理由

自動車を運転するときのことを考えてみてください。運転中、運転席前のメーターパネルに表示される速度計やガソリン残量、カーナビなどを確認しながら運転する方がほとんどではないでしょうか。

メーターがなくても車は走るし、目的地に到達することもできます。ですが、「メーターがない車を買いますか?」と聞かれたら、99.9パーセントの人はきっと買わないと答えるでしょう。

それはメーターが、「この速度でこのカーブを曲がり切れるか」「目的地までオイル補給なしで到達できるか」といったことを教えてくれるからです。また、カーナビが現在地や周辺情報を教えてくれるからこそ、いつも走ったことのない道を走る楽しみを味わうこともできるし、知らなかった抜け道を発見することもできます。

車のメーターは、目的地まで効率よく安全に行ける確度を高め、新しい道を教えてくれる、自動車にとって非常に重要な装置なのです。

データ分析を自動車のメーターに当てはめて考えると、なぜビジネスにデータが必要なのかがよく分かります。データを使わないビジネスは、メーターやカーナビのない自動車を運転しているようなものなのです。

ビジネスにデータ分析を取り入れることで得られるメリットは、大きく2つあります。

一つは、「勝率を高めること」
車のメーターが安全な速度や必要なオイル量を教えてくれるように、データを使うと勝率の高い戦略を導き出すことができます。成果に対して、どの要素がどのくらい影響を与えているのかを方程式化できるからです。成果と要素の関係性を可視化・数値化すると、成功に再現性がもたらされます。

データ分析を取り入れることで得られるもう一つの効果は、「これまで見落としていた欠点を浮き彫りにしたり、思いもよらなかった伸び代を顕在化させたりすること」です。意外にも、データはクリエイティブの源泉なのです。

データは、貯めれば貯めるほど強化されますより学習できるようになり、精度が上がるからです。データの蓄積を始めるのが早ければ早いほど、ビジネスの勝率を高めることができます。

デジタル化がますます進む時代、これまで以上に“データに基づいた判断”が必要になってくるでしょう。

「データを活用する」とは

具体的なデータ活用のフローを解説する前に、「データ」「データ分析」「データ活用」がそれぞれ何を意味しているかについても整理しておきたいと思います。

データとは


「データ」をあえて定義づけるなら、“世の中の事象を定量化したもの”といえるでしょう。つまり、どんなものでも定量化できればデータになるのです。

データとは何かと聞かれたとき、「2021年8月1日はのり弁当が20個売れた」という購買データや、「2021年7月の平均気温は25.9度であった」という気象データなどを想像する人が多いのではないでしょうか。

データは大きく「量的データ(量的変数)」「質的データ(質的変数)」に分類できます。

量的データは、例に挙げたような個数や気温、件数、頻度、身長・体重など、単位のつく数値で表せるもの。一方の質的データは、性別や血液型、好きな芸能人や好き嫌いなど、カテゴリーを区別するものをいい、数値ではなく「あり・なし」や「A・B・O・A B」などの文字で表されます。

量的データと質的データ

技術の進歩により、質的データでも定量化する工夫ができるようになってきました。これからは、データ分析で扱えるデータの種類がますます増えていくことが予想されます。

データ分析とは


“データから情報を取り出すこと”をデータ分析といい、データ分析には「記述統計」「推測統計」という2種類の手法があります。

記述統計は、集めたデータを図表やグラフにし、”データを見やすくして特徴を探る”分析の手法です。

たとえば、学年ごとの平均身長と平均体重を記録した数値データ。これらを棒グラフや折れ線グラフにすると、学年ごとの平均身長の差異や、身長と体重の関係性が見えやすくなります。このように、データを見やすく加工して、収集したデータの性質を把握する取り組みが記述統計です。

一方の推測統計は、一部のサンプル(統計学では「標本」という)から全体の傾向を捉え、”データを見てもわからない情報を取り出す”分析の手法です。

たとえば選挙速報。「開票率1%で当選確実」というニュースを見て、なぜ分かるのだろうと不思議に思ったことはないでしょうか。統計分析はよく味噌汁に例えられます。鍋いっぱいに入っている味噌汁のうち、お玉ですくったひとすくいも同じ味噌汁です。選挙速報では、開票した表の一部をサンプルとして全体の傾向を探り、当選・落選を判断しています。このようにサンプルを取って全体を把握しようという取り組みが推測統計です。

全国で投票された選挙票をすべて開票するのが難しいように、すべてのデータを集めるのが困難なケースも多くあると思います。そのようなときにはこの推測統計を使います。

データ活用とは


データ分析によって、「身長と体重の増加は比例している」といった情報や、「男子は小学6年生から中学1年生の間の身長の伸びがもっとも大きい」など、何らかの情報が抽出されます。

 “抽出された情報を目的に合わせて解釈し、適用する”のが「データ活用」です。

たとえば、「20:00以降にごはんを食べると太る」という分析結果(情報)があったとします。

この情報を、「スポーツのために体重を●●kg増やしたい」という目的を達成するために活用するのであれば、「夜ごはんの量をこれまでより●●パーセント増やそう」となります。けれどももし、「体重を適正体重まで落としてダイエットに成功したい」が目的であれば、「夜ごはんは●●時までに食べ終わっていたほうがよい」となるでしょう。

このように、目的が変われば分析結果の解釈とアクションは大きく変わります。ビジネスでデータを活用する際も、目的の設定は非常に重要です。

データ分析の8ステップ

ここからは、ビジネスにおけるデータ活用のフローを、8つのステップに分けて紹介していきます。

ビジネスでデータを活用するときにもっとも重要なのが、以下のフローに沿って進めることです。頭から順に進めていき、「おかしい」と思ったら前に戻る。このフローに従わずに進めると、そのデータ分析は失敗に終わる可能性が高くなってしまいます。

データ分析の8ステップ

Step1:目的(達成したいことを明確にする)


先述のとおり、目的によって解釈やアクションは大きく変わります。なので、まずは“なぜデータ分析をするのか”という目的を明確にすることが重要。
「売上を最大化したい」「新規事業を成功させたい」など、会社としての大きな目標を自分ごと化し、データを活用して達成したい目的にまで落とし込む作業が、データ分析の最初のステップです。

Point)当たり前。でも重要な“目的意識”

一見当たり前に思われるかもしれませんが、目的があいまいなまま分析をした結果、多大な労力と費用をかけて分析をしたのに有益な示唆が得られずに終わるケースが多くあります。組織で分析・意思決定・巻き込み・実践への落とし込みを実現するためには、強い目的意識を持つことが重要です。

Step2:課題(解決したい課題を特定する)


データ分析の目的が明確になったら、目的を達成するために解決すべき課題を特定します。課題を特定するためのアプローチは2つあります。

1. 何が課題か想定できる場合:実データから特定する

(e.g.)目的が「売上を最大化したい」の場合:
① 売上を構成する要素を分解

売上を要素分解した図

② 要素をシンプルなグラフにし、成果やコストを比較

既存売上と新規売上を比較した折れ線グラフ
コンバージョン数と流入数を比較した折れ線グラフ

③ 課題を特定

ディスプレイ広告とリスティング広告の効果を比較した折れ線グラフ

2. 過去のデータがなく、何が課題か想定できない場合(新規事業を創出する場合など):未来の仮説(こうなるのではないか)をつくり、想定される未来の課題を洗い出す

(e.g.)目的が「売上を最大化したい」の場合:
① 未来の仮説を立てる
② 仮説に近い過去のデータを参考に、因果関係を推測する
③ 課題を特定する

未来の仮説(達成したいビジョン)から課題を特定する手順を説明した図

Point)課題は、2つのアプローチのいずれかを使って特定する

これらのアプローチを使わずに課題を特定しようとすると、妄想で課題を設定することになります。そうすると、課題を達成しても目的が達成されないという落とし穴にハマってしまうので注意が必要です。

Step3:仮説(課題を引き起こす要因を推測する)


課題が明確になったら、その課題を引き起こしている要因を推測します。「Step2:課題の特定」と同じように、ここでも要素の洗い出しと構造化からスタートします。

(e.g.)「リスティング広告の流入数が少ない」が課題の場合:
①「リスティング広告の流入数」を構成する要素を洗い出す
②洗い出した要素を構造化する

「リスティング広告の流入数」を構成する要素を洗い出した図

Point)構造化したら、「因果関係は正しいか」「MECEになっているか」の2点を確認する

構造化する中で、因果関係の間違いや要素の抜け漏れ・重複があると、精度の高い仮説が立てられません。構造化したら、以下の4点を確認しましょう。

● KPIと要因(施策)が同じステップで扱われていないか
● 課題とKPI/KPIと要因が逆になっていないか
● 課題を説明する要素に漏れがないか
● 要素に重複はないか

③ 課題を引き起こす要因を推測する

Point)仮説を立てる際は、チームメンバーや組織外の人と意見交換をする

自身の経験が仮説の範囲を狭めてしまったり、仮説の矛盾に気づかないまま進めてしまったりするケースがよくあります。仮説を立てる際は、社内外の人の意見を聞き、仮説の精度を高めることが重要です。

④ 想定される分析結果を推測する

Point)仮説をつくる時点で、想定される分析結果も想定しておく

仮説を立てたら、“その仮説を実証したらどのような分析結果が出るか”まで考えておきましょう。
たとえば、「売上増加には、テレビCMと新聞広告が効いている」という仮説を立てたときは、「テレビCMは売上の○○パーセント、新聞広告は○○パーセントに影響を与えている」といった分析結果まで想定するようにします。

リスティング広告の流入数に影響を与える要因を推測する図

Step4:データ(仮説を実証するために必要なデータを集める)


「Step4:データ」では、Step3で立てた仮説を実証するために必要なデータを集めます。

分析に必要なデータ

Point)データを集める際は、“仮説を実証するために必要なデータは何か”という視点で考える

持っているデータをそのまま使って仮説を実証しようとすると、場合によっては間違った分析をしてしまいます。以下の例を参考に、“仮説を実証するために必要な形”を考えましょう。

(e.g.)「夏の暑い日ほど売上が落ちる」という仮説を実証したいときは、持っている気温データをそのまま使うのではなく、“仮説を実証するために必要な形に変えて”使う

元データをそのまま使う場合
「8/1は30度、8/2は32度……」といった気温データ

→そのまま使って分析をすると、「季節を問わず、気温が1度上がると売上が●●円下がる/上がる」という、夏に限らない分析結果が得られ、仮説を実証できない。場合によっては誤った分析の示唆を導き出してしまう。

データの形を変えて使う場合
「気温30度以上の日は1、30度未満の日は0」といったフラグを立てたデータ

→「30度以上の日に売上が●●円下がる/上がる」のような、気温と売上の関係性が分かる分析結果が得られ、仮説を実証できる。

Step5:分析(集めたデータを分析する)


集めたデータを、仮説を証明するために適切な分析手法で分析します。
(※詳細は、第2回の記事で解説します)

Step6:解釈(目的から分析までが一気通貫しているか振り返る)


解釈のステップは、このあとアクションを実行すべきかを判断する最後のとりで。目的から分析までが一気通貫しているか否かを振り返る作業=解釈、と考えると分かりやすいです。

データ分析の8ステップ「Step5:分析」は、目的から分析までが一気通貫しているか否かを振り返る作業

Point)振り返りは、Step3で立てた“仮説” と “想定した分析結果” を、実際の分析結果と見比べて行う
(一フェーズずつ戻って確認する必要はありません)

1. 仮説も分析結果も、当初想定していたものと違う場合

①「Step1:目的」に戻り、“どういう目的で分析をしたのか” “特定した課題は何だったか”を確認する
②最初に立てた仮説とは別の因果関係をもとに仮説を立て直す
③再度、「Step4:データ」「Step5:分析」「Step6:解釈」と進める

仮説も分析結果も、当初想定していたものと違う場合の対応

2. 仮説は合っているが、分析結果が当初の想定と違う場合

①「Step4:データ」に戻り、データに間違いがないかを確認する
②正しいデータを集める
③再度、「Step5:分析」「Step6:解釈」と進める

仮説は合っているが、分析結果が当初の想定と違う場合の対応

Step7:巻き込み(データをもとに組織を動かす)


仮説が実証されたら、組織を巻き込んでアクションの実行に進みます。
(※詳細は、第3回の記事で解説します)

データ分析の8ステップは「分析」「巻き込み」「実行」の3セクションから成り立つ

Step8:実行(決定したアクションを実行する)

まとめ

以上、データ分析の8ステップを紹介してきました。

この8ステップを順番にやらないと、目的不在のデータ分析になりやすく、データ分析をアクションの実行まで繋げられない可能性が高まります。

特に、「こんな分析がしたい→こんなデータがほしい→こんな仮説もあるのでは?」と、フローを逆走していくパターンは、いちばんよくないデータ分析だといえます。アクションに繋げられないデータ分析はビジネスで活用できず、分析のための分析で終わってしまいます。

この8ステップを見てもらうと分かるとおり、数学や統計分析の専門知識を必要とするのは「Step5:分析」だけ。データ分析で重要なのは、明確な目的意識と精度の高い仮説、経験が育てる想像力と創造性です。すでに業務に関わっている方なら、これらはきっと持ち合わせていると思います。

はじめてデータ分析をする方も、ぜひ一度、この8ステップを一気通貫で体感してみてください。

▶︎▶︎▶︎ 連載2本目では、ビジネスパーソンが覚えておくべき3つの分析手法を紹介しています。こちらもぜひご一読ください。
【ゼロから始めるデータ分析#2】ビジネスパーソンが覚えておくべき3つの分析手法

データ分析をゼロから学びたい人におすすめの書籍3選 

西内啓(2013)『統計学が最強の学問である』ダイヤモンド社
統計学は何のためにあるのか。何の役に立つのか。現代社会と我々の人生に、統計学が与えるインパクトの大きさを実感できる一冊です。

鳥居泰彦(1994)『はじめての統計学』日本経済新聞出版
数学が苦手な人でも理解できるよう、丁寧に解説された統計学の入門書。統計学とは何かを体系的に理解するためにまず読みたい一冊です。

森岡 毅・今西 聖貴(2016)『確率思考の戦略論』KADOKAWA/角川書店
ユニバーサル・スタジオ・ジャパン(USJ)のV字回復の裏に存在した「数学マーケティング」について詳細に書かれています。データ活用の具体的な事例がイメージできる一冊です。

※Amazon商品ページのリンクを掲載しています

株式会社サイカ 代表取締役CEO 平尾 喜昭 

父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。 

データサイエンスは「経験と勘」を活かす手段

AmazonやWalmart、NETFLIXなど、成功した企業の多くがデータを積極的に活用しており、ビジネスの成果を上げる上でデータが重要であることは、誰もが認識するところだ。それでもなお、データというものに苦手意識があり、自分には縁遠いものだと感じている人は少なくないのではないだろうか。 

本記事では、データサイエンスによって達成できることと、その可能性の大きさをあらためて見つめるとともに、いま企業がデータサイエンスに取り組む意味・意義を、サイカCEO平尾喜昭に聞く。 

株式会社サイカ 代表取締役CEO 平尾 喜昭(ひらお・よしあき) 
父親の倒産体験から「世の中にあるどうしようもない悲しみをなくしたい」と強く思うようになる。慶應義塾大学総合政策学部在学中に統計分析と出会い、卒業直前の2012年2月、株式会社サイカを創業。創業前にはバンドマンであったというユニークなキャリアも持つ。 

「非連続な成長」を実現する、データサイエンスへの期待 

―近年、「データサイエンス」への注目が急速に高まっていますが、その理由をどのようにとらえていますか。 

9年前、サイカを創業した2012年と比べると、データサイエンスを取り巻く状況は大きく様変わりしました。当時から、データサイエンスは「重要視」こそされていたものの、より一般的に注目されるようになったのはここ5年ほどのことです。 

さまざまな事象をデータ化して収集・蓄積することの重要性が「ビッグデータ」というキーワードとともに語られた、データサイエンスの黎明期。その時期を経て、収集したデータを加工・整理することへの関心が高まっていきました。この頃には、BI(ビジネス・インテリジェンス:ビッグデータを整理・可視化し、経営の意志決定を支援する)ツールを提供する企業が次々と上場を果たすなど、市場が大きく伸びていきました。 

そして近年、整理されたデータを分析して“次のアクション”に活かしたいというニーズが高まってきたことで、おのずとデータサイエンスが注目されるようになったのです。 

データは「集める」「溜める」「整理する」だけでは意味がなく、目標達成や課題解決のために「分析する」必要がある──いま振り返ってみると当たり前の帰着のように思えます。しかし、世の中に流通するデータが膨大かつ多様になり、データを管理・活用するためのツールが広く普及してきたことを背景に、「せっかく手元にあるデータを、有効に活用したい」と考える人・企業が少しずつ増えてきたのが、この10年ほどの間に起きた変化だったのだと思います。 

これに加えて、いくつかの事象が、データ活用の気運の高まりに拍車をかけました。 

なかでも潮目を大きく変えたのが2013年に出版された『統計学が最強の学問である』(著:西内啓)です。普段データというものに馴染みがなかった人を含めて、統計学やデータサイエンスの存在が広く一般に知られ、意識されるようになりました。データサイエンティストをはじめとするデータを取り扱う人材が「かっこいい(+稼げる)」存在として認識され始めたのもこの時期だと思います。 

映画『マネーボール』(※1)が公開されたのも、GAFAが加速度的に成長していったのも、おおよそ同時期のこと。データを駆使して成功した人や企業のエピソードが“クール”にパッケージングされて発信されたことで、データサイエンスは人々の中で「注目すべきもの」へと急速に変わっていきました。 

ひとつポイントと言えるのは、どの事象も、データ活用によって「非連続な成長」を果たしたエピソードだということです。 

『マネーボール』のオークランド・アスレチックスは、データを駆使することで2000年から4年連続でプレイオフに出場し、その間に2度、シーズン100勝以上を記録する快挙を成し遂げました。最初は小さなスタートアップだったGAFAは、データを駆使することで非連続的に大手企業へとのし上がっていきました。 

これまで見えていなかったこと、気づいていなかったことがデータによって明らかになり、「データを駆使すれば、潤沢な資源がなくとも勝つことができるのではないか」という期待が、人々をさらにデータサイエンスに引き付けたのだと思います。 

これまでの延長線上では勝つこと・生き残ることが難しくなった時代、多くの人・企業が待望していた「武器」として、データサイエンスは受け入れられたのだと考えています。 

※1:『マネーボール』 
メジャーリーグの貧乏球団を、独自の理論「マネーボール理論」によって常勝球団へと育て上げた、実在する球団ゼネラルマネージャー ビリー・ビーンの半生を描いた映画。マネーボール理論は、各統計から選手を客観的に評価する「セイバーメトリクス」を用いる。

データサイエンスの2つの効果「確実性を高める」「意外な発見をもたらす」 

―データサイエンスで実現できることとは、ずばり何でしょうか。 

一言で言えば、「確実性を高める」ことです。政治にしろ、ビジネスにしろ、スポーツにしろ、「勝つべくして勝つ」「勝つ確率を上げる」ことができるようになるのが、データサイエンスの力です。 

ですから、データサイエンスは「勝つための法則性を導き出す作業」と言い換えることもできますね。 

データを使って「確実性を高める」方法には、大きく2つのパターンがあります。「仮説を実証すること」と「仮説を立てるためのヒントを得ること」です。 

企業の広告活動を例にとってみると、データを使うことで「売上を高めるためには、広告Aより広告Bを強化すべきなのではないか?」という仮説を検証することもできますし、仮説に反する場合は、これまで想定していなかった広告媒体やクリエイティブの可能性を探ることもできます。 

データサイエンスが活きる領域は、もちろん広告だけではありません。「勝つための法則性を導き出す」ことで達成できることの幅は広く、次のようなこともデータサイエンスで実現されてきたことの一例です。 

事象をデータ化することさえできれば、データサイエンスを行うことができます。 

技術の進歩により、世の中のほとんどすべての事象は何らかの形でデータ化することができますし、どんなデータでも何らかの方法で分析することができます。データサイエンスに達成できない目的・解決できない課題はないといっても過言ではありません。 

あらゆる目標達成・課題解決に使えるからこそ、企業規模や業種業態を問わず、「データ活用によって成功した企業」の事例も枚挙にいとまがありません。 

NETFLIXは、1998年、わずか30名の社員とともにDVDソフトの郵送レンタル・販売事業を開始しました。同社はプログラミングに精通したデータサイエンティストを雇い、データ分析を駆使したレコメンド機能やパーソナライゼーション、オリジナル作品の企画制作を推進しました。これによって指数関数的な成長を遂げたNETFLIXは、2020年に売上高250億ドル(約2兆5915億円)を達成しています(※2)。 

Walmartは、データ分析力を武器に世界最大の小売チェーンへとのし上がりました。同社は定量的な販売・在庫データだけでなく、地域固有のニーズや気象によるニーズの変化など、定性的なデータの分析にも長けていました。また、得られたデータや分析結果をサプライヤーにも提供することで業界全体の成長を後押ししていることでも知られています(※3)。  

あえてこうした例を挙げるまでもないほど、データを駆使してビジネスの成果を上げることは、もはや息をするのと同じように、ごく当たり前のことになりつつあります。 

※2 
出典:『分析力を武器にする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 』、『Harvard Business Review(https://hbr.org/2018/01/data-can-enhance-creative-projects-just-look-at-netflix)』、『Netflix, Inc.決算資料(https://s22.q4cdn.com/959853165/files/doc_financials/2020/q2/FINAL-Q2-20-Shareholder-Letter-V3-with-Tables.pdf)』)  

※3 
出典:『分析力を武器とする企業(トーマス・H・ダベンポート、ジェーン・G・ハリス著、日経BP、2008年) 

データサイエンスにおいて最も重要なのは「経験と勘」 

―データサイエンスは、具体的にどのように進めていくのでしょうか。 

データサイエンスは、❶~❽の8つのプロセスから構成されます。 

❶目的:達成したいことは何か 
❷課題:何から解決するべきか 
❸仮説:何が要因なのか 
❹データ:どんなデータが必要か 
❺分析:どんな分析を行うべきか
❻解釈:どのような判断を行うべきか
❼巻き込み:どのように組織で動いていくか
❽実行

❶~❽を概観すると、「データ」という言葉が登場するのは、プロセス全体におけるちょうど真ん中あたり。いきなりデータを触り始めるわけではないのです。また、統計やデータ分析の専門性が求められるのは❹・❺だけです。 

データサイエンスは、実は「データ」「分析」以外の要素が占める割合のほうが高い。ですから、データサイエンスを「理系の人がやること」「統計の専門知識がないとできないもの」と考え、自分には縁遠いものと感じている人が少なくないと思いますが、それは大きな誤解なのです。 

むしろ、データサイエンスにおいて最も重要なのは、「目的」「課題」「仮説」で、データ分析の方針を設定すること。そして「解釈」で、目の前に差し出されたデータに関係性を見出し、ストーリー化することです。 

これを疎かにすると、いくら大量のデータを手に入れて高精度の分析手法を用いても、データから有効な示唆を得ることも、分析結果を成果につなげることもできません。 

逆に、「目的」「課題」「仮説」「解釈」さえできれば、「データ」「分析」については専門人材に任せてもよいのです。 

―データサイエンスは、いわゆる“文系”の人でも実践できるのですね。 

むしろ、データサイエンスに漠然と苦手意識を持っている“文系”の人のほうが、データサイエンスに向いているケースが多いかもしれません。 

世の中のさまざまな事象の間にある因果関係を想像し、仮説を立てること。この「仮説力」こそが、データサイエンスの実践に欠かせないスキルだからです。 

昔、とあるコンビニチェーンがデータサイエンティストを大勢雇って「売上に起因する要素」を探るべくデータ分析を行ったところ、導き出された答えは「雨が降ったら売上が下がる」という至極当たり前のことだったという話があります。もちろんこの結果自体が間違っているわけではありませんが、仮説なしに分析しても、データから有効な示唆を得ることはできないということがよくわかる逸話です。 

仮説がなければ、データ化されず、分析もされない事象がある。つまり、仮説力がないと気づけないこと・得られないことがあるということです。今後、分析技術がコモディティ化していく中、「仮説力」がデータ分析における優位性はもちろん、ビジネスそのものにおける優位性をも生むといえます。 

そして、この「仮説力」の基盤となるのは、一人ひとりが持っている「経験や勘」だと考えています。 

たとえば、一般的に、店舗の売上にはネガティブな影響を与えると言われる「雨」。この事象をデータ化して分析する際に、「雨が降ったら売上が下がる」といった仮説を下記のように深掘りしていくと、有効な示唆を得られる可能性が高まります。 

■雨は降れば降るほど売上が下がるという仮説の下、降水量を調べる
■雨の量が一定量を超えると売上が下がるという仮説の下、降水量と売上の関係を調べる
■単純に多いか少ないではなく、降水量によって売上に違いがあるという仮説の下、○mm~○mm/△mm~△mm/□mm~□mmのように降水量をカテゴライズし、それぞれについて売上への影響を調べる
■降水量と気温の組み合わせが売上に影響するという仮説の下、降水量だけでなく気温と売上の関係も調べる

小売りの経験があることは、こうした仮説と分析プランを立てる上で非常に有利に働くと言えます。「雨の日でも、来店するお客さまは一定数いる」という経験や、「雨が降っていて、かつ気温が高い日に売上が下がる気がする」といった勘があるからこそ、筋の良い仮説を立て、適切なデータ化の方法を考えることができるのです。 

データサイエンスは、経営者やマーケターなど一人ひとりの人が持つ「経験や勘」を、目標達成や課題解決に最大限に活かすためのツールと言えます。 

データサイエンスによって、“人間力”で勝負できる時代へ 

―データサイエンスに「経験と勘」が活きるというのは、意外な感じがしますね。 

一時、マーケティング業界を中心に「データサイエンスは、人の経験や勘に頼らず、データに基づいて法則性を発見し、再現性を高める手法である」という言い方をされていた時期がありましたが、大きな間違いです。 

この誤った認識が、データサイエンティスト以外の、いわゆる一般ビジネスパーソンの中にデータサイエンスに対する抵抗感を生み、データサイエンスの普及を阻害する一因にもなってきたように思います。 

データサイエンスは、人の経験や勘を最大限に活かすための手段。この正しい認識を広めることで、より多くの人・企業にデータサイエンスを実践してほしいですね。 

―より多くの人・企業がデータサイエンスを実践するようになると、社会はどのように変わっていくでしょうか。 

「準備は十分整った、あとは自らの才能で勝負するだけ」と言える社会になるのではないでしょうか。実際、そういう社会をつくりたいと考えたのが、サイカ創業のきっかけでした。 

現状、データサイエンスは“持つ者と持たざる者”がいる状況。つまり、実践できている企業と実践できていない企業で二極化していて、前者が勝ち続ける状況が出来上がってしまっています。 

データサイエンスをより多くの人・企業に行き渡らせることができれば、最後は“人間力”で勝負ができるようになります。ビジネスでいえば、お客さまと向き合い続けることで培われた顧客視点、社会や市場の動向を見極める観察眼、その人独自の感性や感覚、物事にじっくり向き合う胆力や情熱といった、人間ならではの能力をもっと活かせる時代がやってくると思います。 

「もっとリソース(ヒト・モノ・カネ・情報)があったら勝てたかもしれないのに」という悔しい思いをせず、自分の才能で勝負できる、納得感のある世界をつくること。それが私の目標であり、データサイエンスが持っている可能性でもあります。 

[インタビュー・文]齋藤千明 
[撮影]小池大介 
[企画・編集]川畑夕子(XICA)