そろそろ実際の社内データでデータ分析を試してみたい人にお勧めしたい最初の分析と注意点

ビッグデータという単語がメディアに頻出するようになって久しいですが、実際に話題になり始めたのは2011年下旬からで、ピークを迎えたのは2013年夏みたいです。その後は登場回数も落ち着きつつあり、直近1年間(2015年8月~2016年9月)は50件前後/月程度で推移しています。

グラフ1:Googleトレンドによるビッグデータのグラフ
グラフ1:Googleトレンドによるビッグデータのグラフ

(出所:Googleトレンド)

完全に定着した感のある単語で、そろそろ導入・実践事例も増えつつあるため、「自社でも試してみよう」「自分で社内データを使って分析してみたい」という方も増えているのではないでしょうか?

今回はそんな方向けに、

  • 最初に取り組むべき分析
  • 見落とされがちな注意点

について考えていきます。

最初に取り組むべきデータ分析

データ分析において、分析者は「新しい発見をする」ことを期待しますし、期待されます。もし、それができれば素晴らしいことです。例えば、スキルアップは各従業員自身に任せている会社を想像してください。その会社において、受注率に好影響を及ぼすものとして、営業部員の「読書量」があることがわかったとします。このとき、会社としての業績向上のために導入するのは「顧客管理ツール」ではなく「強制参加の読書会」になるかもしれません。スキルアップを社員任せにしていた会社にとって、「読書量が受注率に好影響を及ぼす」ということは「新しい発見」に違いありませんので、これは非常に価値のある分析だったといえます。

一方で、「新しい発見」ではなく、社内で共通認識として持たれている「当たり前のこと」や「常識」が実際に効果があることを確認することにも価値があります。それは、「当たり前」や「常識」が間違っている(=非効率の温床)リスクを排除できるからです。また、同一のデータ分析を定期的に行うことで、今まで効果があった「当たり前のこと」や「常識」が、環境の変化等により効果がなくなってしまった時、そのことに気付けるようになります。市場環境の変化を察知することに大きな価値があることは自明だと思いますので、やはり「当たり前のこと」や「常識」の効果測定には価値があるのです。

もし、実際の自社データを使って分析を行うのであれば、その第一歩としては「当たり前のこと」や「常識」に効果があることを確認するのがよいでしょう。

架空企業の事例で「当たり前」を確認する

分析するためのデータを全く収集していない会社は多くないでしょうし、社内で「当たり前のこと」として認識されていることであれば、それを適切に行えているかどうかを確認するためにデータとしても存在していると思います。

まずはそのデータを使って分析を開始して、どんな分析結果が出るかを確認してみましょう。今回ははじめてのデータ分析ですので、専用の分析ツールではなく、Microsoft Excelで分析してみましょう。

とりあえずの事例として「顧客への訪問件数が多い方が、毎月の売上額が増加する」という多くの営業会社において「当たり前」とされていることを確認してみます。

収集するデータは「各営業部員の月次売上」と「各営業部員の月次訪問件数」です。この2変数の関係をみることで、月次売上と月次訪問件数が関連しているかどうか、その関連の程度、また、1件の訪問件数がいくらの売上に繋がるかが見えてきます。(エクセルでの分析についてはこちら(別記事へのリンクを貼る)に詳しく記載しています)

分析結果とデータ分析における注意点

分析結果は下記のとおりです。分析に使った仮想データは末尾からダウンロードできます。

グラフ2:月間訪問件数と月次売上高
グラフ2:月間訪問件数と月次売上高

グラフを見る限り、緩やかな相関がありそうです。
表1:分析結果(エクセルの回帰分析)
表1:分析結果(エクセルの回帰分析)

回帰分析の結果、訪問件数と売上には正の相関関係(訪問件数が多ければ多いほど、売上も上がる)があり、1件訪問件数が増えれば、平均的に約15,341円の売上向上に繋がることがわかりました。

ただ、決定係数が0.116ですので、月次売上のうち約11.6%程度しか説明できていないことになります。これが想定通りか否かの感じ方は人それぞれですが、この会社においては「訪問件数のみを管理する」のでは不十分である可能性が高いですね。なぜなら、売上の決定要因のうち、訪問件数が説明できる部分が全体の11.6%しかないのですから。

実際に社内データを用いて分析する上で注意する必要があるのは「データの信頼性」です。これについては別の記事で深く触れますが、分析のもとになるデータに不十分な点があると、当然分析結果も現実をあらわしたものではなくなってしまいます。

例えば

  • データに入力漏れがある(訪問件数が入力されていない日がある等)
  • データの一部に間違いがある(訪問件数を誤って入力し、そのままになっている等)
  • データを取得する対象に偏りがある(成績上位の営業のデータのみ集計している等)
  • そもそもサンプルサイズ(データの量)が小さい

などはデータ分析において、その結果の信頼性を貶める要因としてよく出てきます。多くの場合、集計方法を整備し、十分な観測期間をおくことでクリアできる問題ではありますので、本格的に分析を開始するのであれば、集計ツールの導入を検討するとよいでしょう。

まとめ

今回は、これから(あるいは、はじめて)データ分析に取り組む人が、最初に取り組むべき分析について、また、その際の注意点について記載しました。

最初に取り組むべきは、

  • 既存の社内データを使った
  • 社内の共通認識の効果測定

で、注意点として

  • 分析に使用するデータの信頼性

を挙げました。

エクセルを使っての分析から何らかの示唆を得られ、その有効性を確認できれば、本格的にデータ集計・分析に取り組むためのツール導入を検討するのがよいでしょう。

the-first-analysis.xlms(エクセル2016で作成したファイルです)