株式会社サイカ

〒106-0032
東京都港区六本木3丁目1-1
六本木ティーキューブ14F(受付14階) Google Mapで見る

JP EN

バイアスとは|意味と種類【データ分析時の注意点まで解説】

コラム
ステレオタイプダイバーシティ

バイアス(bias)とは、「偏り」「偏見」「先入観」などを意味し、認識の歪みや偏りを表現する言葉として使われます。

日常のビジネスシーンや、データ分析の現場では、そのバイアスが作用することが多々あります。バイアスを認識・是正しないままでいると、非論理的な意思決定を下してしまったり、データの価値を存分に引き出せなかったりと、さまざまな弊害が生じてしまいます。

バイアスの種類は数多ありますが、この記事では、ビジネスパーソンが日常的に意識すべき10種類のバイアスと、データ分析にはじめて触れる方に特に気をつけていただきたい4種類のバイアスについて、なるべく簡潔に分かりやすく解説します。

「データを武器にしたい」と考えているビジネスパーソンは、この記事で解説するバイアスを意識しながら、正しいデータ分析を目指してみてください。

バイアス(bias)とは?

バイアス(bias)は日本語で、「偏り」「偏見」「先入観」などの意味がある言葉です。

たとえば、英語圏では「I might be biased but I think〜(偏見かもしれないけれど、〜と思うんだ)」のフレーズのように、バイアスという言葉が日常的に使われています。

統計学または心理学の文脈でも「何らかの偏り」のことをバイアスといいます。

統計学と心理学のバイアスの違い

  • 統計学:データの母集団や標本、分析結果から立てられる仮説などに生じる偏り
  • 心理学:個人の経験や社会的通念から生じる、人やものごとに対する意見の偏り

統計学においては、バイアスを極力排除したデータ分析をすることで、より精度の高い示唆を導き出せます。

ステレオタイプ(stereotype)とバイアスの違い

ステレオタイプとは、「多くの人に浸透している固定観念やイメージ、思い込み、概念、思考の型」です。

心理学におけるバイアスに近いように感じますが、バイアスとステレオタイプには明確な違いがあります。

ステレオタイプとバイアスの違い

バイアスとステレオタイプの違いは、『ステレオタイプとは|バイアスとの違いやメリット・デメリットをわかりやすく解説』で詳しく解説しています。

この記事と合わせて読んでいただくと、データ分析で生じやすい偏りについてより深く理解できるので、ぜひ参考にしてみてください。

バイアスのメリット・デメリット

「偏り」や「偏見」という言葉から、バイアスはマイナス印象が強調されがちです。しかし、バイアスにはメリットとデメリットの両方があります。

バイアスのメリット

  • 脳が処理する情報量を圧縮して素早い意思決定を行う
  • 数あるバイアスを認識することで、無意識に生まれるバイアスを排除したデータ分析ができる
バイアスのデメリット

  • 人や物事を単純化することで本質的な特性・性質を見逃してしまう
  • 収集するデータや仮説の偏りにより正しい分析が行えない

ビジネスパーソンが覚えておきたい10種類のバイアス

このセクションで紹介するのは、ビジネスパーソンが日常的に意識したい10種類のバイアスです。これらのバイアスを認識し、是正しなければ、非合理的な意思決定を下す原因にもなってしまいます。

日常の小さな意思決定や人事評価など、あらゆるシーンでバイアスが介入する可能性があるので、十分に注意してください。

また、データ分析を行う際にも意識しておきたいバイアスなので、「自分はどんなバイアスを抱えているか(抱えやすいか)」を意識しながら読み進めてみてください。

ビジネスパーソンが覚えておきたい10種類のバイアス

1. 認知バイアス

これまでの経験から形成される先入観や、直感などにより生じるバイアスを、「認知バイアス」と呼びます。先入観や直感が多く介入するため、非合理的な意思決定を下してしまう原因になりやすいバイアスです。

また、日常的に生じやすいので、あらゆるビジネスシーンで注意が必要なバイアスでもあります。

2. 確証バイアス

認知バイアスの一種に、確証バイアスというものがあります。

人は、「自分が立てた仮説」または「人から与えられた仮説」が正しいかどうかを判断するとき、仮説を反証する情報ではなく、仮説を確証する情報に着目し、それを重視する傾向があります。

これを「確証バイアス」と呼びます。

平たく言えば、「自分に都合のよい情報ばかりに着目してしまう」という心理です。

3. 権威バイアス

人や組織が持つ権威性が影響し、その人や組織が発する情報を無条件で信じてしまうことを、「権威バイアス」と呼びます。

データ分析の現場においては、「あの有名な調査機関が発表したデータだから信頼性が高い」と、データを盲信してしまうケースがあります。

権威性が高いからといってデータが正しいとは限らず、いかなるデータも事前検証が欠かせません。

4. 正常性バイアス

事前に定義したしきい値を超えるようなデータが生じたときに、「大丈夫、これも正常な範囲だ」と思い込もうとするバイアスを、「正常性バイアス」と呼びます。

たとえば、過去に発生した災害において「パニックよりも正常性バイアスが作用して逃げ遅れたケースがある」という指摘があります。

データ分析の現場においても都合の悪いデータを無視したり、過小評価したりしてしまうケースは、少なくありません。

5. 希少性バイアス

なかなか手に入らないものに魅力を感じるバイアスを、「希少性バイアス」と呼びます。「残り1つ」、「期間限定」などの文言に弱い人が多いのは、希少性バイアスが作用するからです。

データ分析の現場では、「苦労して手に入れたデータだからきっと価値が高い」と思い込むケースがあります。

しかしデータの価値は、入手の困難性で決まるものではありません。

6. 内集団バイアス

仲間意識によって生じるバイアスを、「内集団バイアス」と呼びます。いわゆる「身内びいき」のことです。

内集団バイアスは所属しているグループやそのメンバーに対してだけでなく、「同郷出身」などちょっとした関連から生じやすいバイアスです。

7. 後知恵バイアス

結果が出たときに、「やっぱりこうなると思っていた」と思い込むバイアスを「後知恵バイアス」と呼びます。

後知恵バイアス自体はよくあることで、ビジネスやデータ分析に直接的な影響を与えたりはしません。

しかし、後知恵バイアスを持っている人はその他のバイアスも抱えている可能性があるため、バイアスの存在を意識しながらデータ分析に取り組む必要があります。

8. 自己奉仕バイアス

成功は自分のおかげ、失敗は他人や環境のせいにしようとするバイアスを、「自己奉仕バイアス」と呼びます。

たとえば、データ分析で失敗した結果をデータや周囲環境のせいにしてしまう場合は、自己奉仕バイアスが作用しています。データ分析は「1度行って終わり」ではありません。たった1度のデータ分析から正しい分析結果が得られるのは、むしろ稀なことです。したがってPDCAを回し続け、導き出すアクションの精度を高めていくことが、正しいデータ分析には欠かせません。

データ分析がうまくいかなかったとしても、自己奉仕バイアスにとらわれず、「データの収集方法や分析方法など、自分自身に問題はなかったか?」と、フラットな視点で改善点を見極めることが肝要です。

また、データ分析に成功したからといって自分を過大評価するのも、大切な成功要因を見落とす原因になるため、注意しなければいけません。

9. 行為者・観察者バイアス

ミスやトラブルが起きたとき、自分の行動については外的要因まで考慮し、他人の行動については内的要因だけに着目するバイアスを、「行為者・観察者バイアス」と呼びます。

わかりやすく言えば、「自分のミスは環境のせい、他人のミスはその人のせい」とする心理です。

こうした、自分に甘く他人に厳しいバイアスに陥っていると、データ分析に限らず、人間関係においてもトラブルの原因になります。

10. アンコンシャス・バイアス(unconscious bias)

無意識に形成された先入観や偏見のことを、「アンコンシャス・バイアス」と呼びます。

データ分析においては、「普通はこうする」「この場合はこの分析手法が合っている」など、無意識の先入観により分析を間違った方向に導く可能性があります。

また、アンコンシャス・バイアスはあらゆるビジネスシーンで生じる、社会問題の一つです。詳しくは『アンコンシャスバイアスとは|具体例で知る要因と改善方法、バイアスとの違い』で紹介しているので、参考にしてみてください。

データを扱う時に気をつけたいバイアス

ここからは、特にデータを扱うときに気をつけていただきたいバイアスを4つ解説します。

データを扱うときに気をつけたい4つのバイアス

また、予備知識として「母集団と標本の関係」「系統誤差と偶然誤差」を解説します。データ分析でバイアスを排除するには、これらの予備知識がとても重要です。

母集団と標本の関係

母集団とは、データ分析の対象となる集団(データの集まり)のことです。

たとえば、日本に住むビジネスパーソンの正確な平均年収を割り出すためには、日本の就業者数約6,723万人(*1)を母集団として、年収データを集めなければいけません。

すべての年収データから平均値を割り出すことで、母集団を観察できます。データ分析の現場ではこれを、「記述統計」と呼びます。

しかし、日本の就業者数約6,723万人すべての年収データを集めるのには、莫大なコストと時間がかかります。

現実的な分析手法ではないため、母集団から一部の標本を抽出し、分析することで母集団の特性を明らかにする手法がよく用いられます。これを、「推測統計」と呼びます。

【ゼロから始めるデータ分析#1】データ分析初心者がまず知るべき「分析の8ステップ」|サイカロン

記述統計と推測統計

母集団から標本を抽出するときは、さまざまなバイアスが生じ、間違った分析結果を得てしまうリスクがあります。したがって、「何を基準として標本を抽出するか?」がとても重要です。

(*1)※2022年 労働力調査より引用 https://www.stat.go.jp/data/roudou/

系統誤差と偶然誤差

データ分析の現場において、「データの誤差」はつきものです。データの誤差は、系統誤差と偶然誤差という2種類に大きく分けられます。

系統誤差とは、収集するデータやその加工方法、分析方法などの違いによって生じる「分析結果の差」を意味します。

たとえば、ビジネスパーソンの平均年収を調査するにあたって、日本全国を調査対象とするのか、あるいは都道府県別に調査するのかによって調査結果が変わります。このように、データ分析の条件によって生じるのが系統誤差です。

偶然誤差とは、同じ条件下でデータ分析を行なったときに生じる「分析結果のばらつき」を意味します。

たとえば、東京都に住むビジネスパーソンの平均年収を調査するとします。同じ母集団から、同じ数だけの標本(サンプルデータ)を抽出してデータ分析を行なっても、分析するたびに結果のばらつきが生じます。これは、母集団から抽出した標本ごとに特性が異なるためです(この場合は年収金額)。

データ分析から正しい結果を得るためには、系統誤差と偶然誤差の両方を、計画段階から意識しなければいけません。

系統誤差と偶然誤差

1. 生存者バイアス

「生き残ったデータのみが強調される」という、データの分析結果を得るときによく生じるバイアスです。

データ分析においては、収集した(選択した)データのみが分析対象となり、切り捨てたデータは分析対象になりません。

ごく当たり前のことなのですが、収集したデータから得られた分析結果だけが正しいとは限りません。

「切り捨てたデータの中に真実が隠れていないか?」を常に考えながらデータを分析しなければ、表面的な事実だけで意思決定を下すことになります。

2. 志願者バイアス

標本の選択に、個人の意志が入り込むことで生じるバイアスです。

たとえば、東京都のビジネスパーソンの平均年収を調べるために、1,000人の年収データ(標本)を得たとします。

その1,000人は、「自分の年収を明らかにしても恥ずかしくない」と思えるほどの、年収が比較的高いビジネスパーソンから得た標本かもしれません。

データ分析への志願者(参加者)は調査テーマに対する関心が高いため、分析結果にバイアスが生じることが往々にしてあります。

3. サンプリング・バイアス(sampling bias)

特定の標本だけに絞ったデータ分析を行うことで生じるバイアスです。

たとえば、東京都在住者の平均年収を調べるために、1,000人の正規雇用者から年収データ(標本)を抽出しても、正確な分析結果は得られません。

その結果は、あくまで「東京都に住む正規雇用者の平均年収」です。

「東京都に住む正規雇用者の平均年収」を調べることが目的なら問題はありませんが、「東京都在住者の平均年収」となると、非正規雇用者の年収データも収集しなければいけません。

4. アルゴリズム・バイアス(algorithm bias)

偏ったデータをAIに与え続けたり、開発者の偏りが介入したりすることで、機械学習のアルゴリズムに生じるバイアスです。

ただし、偏ったデータを与えるのも、偏ったプログラムを開発するのも、あくまで人です。アルゴリズム自体が悪いわけではありません。

アルゴリズム・バイアスが生じている場合は、開発者自身に何らかのバイアスが生じている可能性が高いでしょう。

効果測定時に気をつけたい「バイアスによるミスリード」

前述した4種類のバイアスに加えて、データ分析に携わるビジネスパーソンに注意していただきたいのが、「バイアスによるミスリード」です。

これは、マーケティングや業務改善などのデジタル施策における、効果測定時によく起こります。

デジタル施策は非デジタル施策と比べて、緻密なターゲティングや豊富なデータ収集を行えます。言い換えればデジタル施策のほうが、何らかのバイアスが介入する可能性が高いということです。

たとえば、テレビCMの場合は性別や年代、地域など大まかに決めたターゲットから、協賛となる番組を決定します。一方で、YouTube広告では性別や年代、興味・関心、ライフイベントなどといった、より緻密なターゲティングが可能です。

ターゲティングとして設定できる項目が細かいほど、マーケターが持つバイアスが介入する可能性が高まります。また、効果測定時には、分析対象とするデータを決めるときにバイアスが生じやすくなります。

このように、バイアスによって間違ったデジタル施策を実施したり、間違った効果測定を行なったりするトラブルを、「バイアスによるミスリード」と呼びます。

おわりに

バイアスはビジネスシーンのあらゆるところに存在し、さまざまなミスリードを引き起こします。

また、データ分析を行う際は、母集団の決定、標本のサンプリング、データの加工方法、分析手法、仮説立案など、データ分析プロセスの最初から最後まで「バイアスの排除」を意識しなければいけません。

人はバイアスに支配されながら生きていると言っても過言ではありません。

自分がどのようなバイアスを抱えているか、あるいは抱えやすいかをまずは自認しましょう。そのうえで、バイアスを排除するためにはどのような思考や実行プロセスが必要かを考えてみてください。

この記事を読んだ方におすすめの記事