データ収集のベストプラクティス:クライアントとの伴走で得た知見をご紹介

XICA Analysis Insight
連載

前回のレポートでは、マーケティング効果可視化の重要性について述べました。本レポートでは、効果可視化をするうえで欠かせない「データ収集」の工程について述べていきます。

データ分析の世界においては、“Garbage In, Garbage Out” (欠陥のあるデータを入力しても無意味な出力しか出てこない)という有名な言葉があるくらい、入力するデータの品質にはこだわる必要があります。

一方で、必要なデータの質にこだわるあまり、データ収集に対する費用対効果が見込めず、データドリブンなマーケティング効果可視化に踏み込めないでいる企業も多数あるのではないでしょうか。

今回のレポートでは、「データ収集」についてお客様と伴走しながら進行していったサイカの知見から、データ収集に関わる具体的な事例を交えて、「データ収集」のポイントをご紹介します。

マーケティングに関わるデータ

近年、データの蓄積・データ分析の重要性が叫ばれる中で、データを蓄積・参照するためのサービスは増加し続けています。一方で、参照できるデータが増えたからこそ、マーケティングのデータ収集についてのノウハウが追いついておらず、結果として「データ収集の難しさ」が、マーケティング効果可視化の障害になっている(※1)のが現状ではないでしょうか。

※1) 企業の広告宣伝担当者に聞いた、広告の効果測定方法に関するアンケート調査

ここで、収集可能なマーケティングに関わるデータには一般的にどのようなものがあるのか、一度洗い出してみましょう。

ⅰ. 売上データ

売上に関わるデータです。自社のビジネスに対して最も関わりが強いデータであり、マーケティング活動も売上を伸ばすための活動の一貫と考えれば、当然取得するべきデータになります。

収集できる売上データの例

  • 売上金額
  • 販売個数

ⅱ. 広告データ

広告の出稿データです。どのような媒体・クリエイティブでどれだけのボリュームを出稿したのか、広告代理店から取得します。

これらの施策が費用対効果をどれだけ生んでいたのかは重要な指標ですが、代理店でCookieデータが追えない場合は費用対効果を算出することが難しいです。

収集できる広告データの例

  • imp数
  • click数
  • CV数
  • 出稿費用
  • 動画再生数
  • 動画視聴完了数

ⅲ. 自社WEBサイト・自社SNS運用のデータ

自社でオウンドサイト運用している場合は自社オーガニックサイトへの流入数やその中での顧客行動をGoogle Analyticsなどのログデータから追うことができます。また、SNSの運用においては投稿への反応がエンゲージメント指標として取得できるでしょう。

自社への関心の高まりや、コンテンツの改善によって生まれた効果を測定するうえで重要な指標と言えます。

一方で、これらが自社の売上にどれだけ寄与しているかは判別することが難しく、自社WEBサイト・運用SNSのデータのみでマーケティング効果を判断することは難しいでしょう。

収集できる自社WEBサイト・自社SNSデータの例

  • SESSION数
  • PV数
  • 運用SNSアカウントのエンゲージメント指標
    • いいね数
    • リプライ数
    • コメント数

ⅳ. 店頭データ

店頭データもマーケティングにおける重要なデータです。商品の店頭価格・配荷率のデータ・店頭イベントやプロモーションに関わるデータはマーケティングにおける重要な示唆を生み出します。

一方、価格や配荷率がマーケティングに及ぼす影響は市場・競合の動向によって大きく変わってくるため、単体でマーケティングの効果可視化 → 解釈は難しいと言えます。

収集できる店頭データの例:

  • 店頭価格
  • 配荷率

ⅴ. 個人IDに紐づくデータ

Cookieの発達によって、個人IDに紐づく購買行動を追うことができます。これにより、顧客ペルソナの仮説を立てること・カスタマイズされた強力なマーケティングのアプローチを取ることができます。

また、ECサイトやサービスサイトを運用している場合はアカウントに紐づく情報からロイヤルティを分類するなど、活用方法は様々にあります。

一方で、近年プライバシー意識の高まりからこういったデータの取得は難易度が上がっており、個人IDデータに寄らないマーケティング活動の重要性が叫ばれていることも事実です。

収集できる個人IDに紐づくデータの例:

  • デモグラフィックデータ
  • CRM系データ
  • 購買履歴

ⅵ. 意識指標(アンケート)データ

顧客のアンケートデータです。認知率のデータや顧客満足度のデータが例に挙げられます。

売上データや広告データと比較すると、サンプル抽出や設問の設計のためにバイアスがかかることが多く、分析に扱うにはより注意が必要な指標と言えます。

一方、これらが売上にどの程度寄与しているのか、商品のPR方法によってどのように変化したのかはマーケティング効果可視化にあたっては、可視化の難易度が高いながらも非常に重要な問いです。

収集できる意識指標データの例:

  • 5段階データ
  • 自由記述データ(カスタマーボイスなど)

ⅶ. 外部データ

ⅰ.~ⅵ.については自社に関わるデータですが、外部から参照できるデータもマーケティングの効果可視化において重要なパーツです。政府調査データや、Googleトレンドなど市場動向や競合の動向、直近でいえば新型コロナウイルスによる消費者行動の変化など、マーケティングの効果可視化をするうえで必要な情報です。

外部データを収集・蓄積しているベンダーも最近はかなり増えてきているので、その可能性は大きく広がってきていると言えます。

収集できる外部データの例:

  • 統計局データ
  • Googleトレンド

上記のように、マーケティングに関わるデータは多岐にわたります。

解き明かしたい仮説によっては、一部のデータでマーケティング効果を可視化することができますが、課題が大きくなるほど複合的に評価する必要があります。

これらのデータをどのように取捨選択していくか、データ収集のプロセスを次に述べていきます。

データ収集のプロセス

マーケティング効果可視化のための「データ収集」は以下のプロセスで進行します。

データ収集のプロセス

マーケティング効果可視化を急ぎ、手当たり次第にデータを収集するのではなく、①分析目的合意・②分析目的に合わせたモデルの設計・③モデルに関わる要因の洗い出し、の手順を踏むことが重要です。

あるいは手元にあるデータから何かしら分析できないかと考えるのではなく、上記のプロセスで明らかにしたいことから逆算してデータ収集に取り掛かることが重要です。

マーケティング効果可視化の意義は、前回のレポート(※2)で示した通り、将来の計画立案・目標達成または未達要因の振り返りにあります。

①~③の工程で関係部署を巻き込み、一度しっかりとした分析モデルの設計ができれば、繰り返し計画立案・振り返りに活用することができます。

※2) 前回のレポート:マーケティング効果可視化におけるデータ活用事例

つまり、一度データ収集の仕組みを作り上げれば、強力なPDCAサイクルを回し続けることが可能になるのです。

一方で、この①~③の工程を怠ると、以下のリスクが発生します。

  • (1)分析目的の合意形成ができていない場合
    • 解き明かすべき仮説が無いため、分析結果を次のアクションに活かせない
    • 関係部署を巻き込めず、データ収集に協力的になって貰えない
    • 各部署で目標が異なるため、部署を横断した分析モデルの設計ができない
  • (2)分析目的に合わせたモデルの設計ができない場合
    • 分析精度を保つために必要なデータを定義できないため、マーケティング効果を正しく可視化できない
  • (3)モデルに関わる要因の洗い出しが出来ていない場合
    • マーケティング効果に影響のある要因を見逃す
    • 必要以上にデータ収集にコスト・労働力を割いてしまい、分析に対する費用対効果が合わなくなる

サイカでは、上記のような状態を防ぐためにお客様と伴走しながら①~③の工程を一気通貫で支えていきます。

次章では、いざデータ分析をするとなった際に困らないように、普段からどのようなデータ蓄積の手段を取るべきかについて述べていきます。

データ蓄積の考え方

サイカでは分析に際し、お客様に必要なデータを収集頂いておりますが、特に分析後のお客様アンケートでも特に多いのが、データ収集に関わる負荷の部分になります。「想定よりも大変である」というのが、多くのお客様に共通するポイントでした。

前述した通り、一度仕組みを整えることによって前述のPDCAサイクルを回せるようになります。マーケティング効果の可視化を進める、あるいはいつでもできる準備をしておくためにも、「どのようにデータを蓄積をするべきか」について述べていきます。

保有するデータ量と分析しやすいデータ構造の関係

「マーケティングに関わるデータ」の章でも述べた通り、データはマーケティングに関わるものだけでも多岐にわたり、全てのデータを蓄積し分析に使用できる形に整えるのは非常に骨が折れる作業です。保持するデータの量と、分析しやすいデータ構造の関係性はトレードオフで、データを欲張って蓄積しようとすればするほどデータ構造は複雑化し、いざ分析しようとなった際に腰が重くなります。

例えば、時系列の売上データとクロスセクションであるアンケートデータは同じ形式のデータベースで持つことは難しいです。このことから分かるように、保持するデータを増やせば増やすほど管理工数も複雑さも増していきます。

膨大なデータを取り扱うための考え方

膨大なデータを扱う際の仕組み・考え方として、データレイク・データウェアハウスという言葉があります。あまりなじみのない単語かもしれませんが、先ほど述べたデータ量とデータ構造の複雑化のトレードオフとの関係性が深い単語になります。

データレイクとは、莫大なデータを取得した形のまま蓄積していく、つまり保持するデータ量を増やしていくことに専念するデータ蓄積の方法です。一方、データウェアハウスとは、分析しやすいように処理されたデータ群の集まりのことです。

管理コスト上、全てのデータをデータウェアハウスの考え方で蓄積することは難しいため、マーケティング効果可視化を思い立った際にすぐに取り掛かれるように準備しておく、という観点で以下のような考え方で取り組むことを推奨します。

構造化しやすいデータはデータウェアハウスで管理する

「データの構造化」についてまずは説明します。Excelの表などをイメージしてもらうと分かりやすいかもしれません。値や記号が表形式に行列で規則性にのっとって記載されている場合、それらのデータは構造化されています。逆に構造化しづらいデータは画像ファイルやカスタマーボイスなどになります。

マーケティングに関わるデータは、時系列に関わるデータと個人や商品のIDに紐づくデータは比較的構造化しやすく、これらはデータウェアハウスの考え方で管理することを推奨します。

例えば、時系列の売上・広告出稿・店頭に関わるデータ(店頭価格や配荷率の推移)・自社Webサイトの流入推移などを時系列データのくくりでまとめる仕組みを作っておくと、いざマーケティング効果の可視化をしたいとなった際にスムーズに進行できるようになります。個人IDや商品IDに関するデータも、構造化できるものは各IDに紐づけてまとめておき、すぐに取り出せるようにしておくことを推奨します。

逆に言えば、上記のように構造化するのが難しいデータはデータレイクの考え方で持っておき、より課題の深堀りや考察をしたい際に活用できるように準備をしておくことが、データ量とデータ構造の複雑化のトレードオフとの上手な付き合い方と言えるでしょう。

まとめ

今回のレポートのポイントは以下です。

  • マーケティングに関わるデータは多様化している
  • データ収集は分析の目的から逆算して進行する
  • データ蓄積は、データ構造に合わせた考え方で効率よく蓄積する

オンオフ統合分析で継続的に獲得効率を把握し、最も効果的なマーケティング運用を

次回以降は、具体的なマーケティング効果可視化におけるデータ分析の手法について解説する予定です。

この記事を読んだ方におすすめの記事