因果関係をどう読み解く?

因果関係をどう読み解く?

因果関係を正確にとらえるための方法

前回は【統計学におけるアカデミックと実務の違い】というタイトルで回帰分析を用いることで、世の中にあるYとXという2つの関係を、Y=a+bXという直線の関係で表し、aとbの値を計算することで客観的に見ることができることを説明しました。

ただ、回帰分析で出てくる結果はあくまで2つのデータの間に関係性がある(このことを相関関係といいます)ことを示しただけで、「Xが変化したからYが変化した」という因果関係まで議論するのは、少し言い過ぎになってしまいます。

例えば、ある人口減に悩んでいる市町村のデータをとってみたところ、Yの人口、Xに育児対策費を入れて分析するとbの値は正の値を取ることがわかったとします。このとき、「育児対策にお金をかければ人口が増える」という政策を売り込むことが果たして望ましいのでしょうか。この結果については、むしろ「昔は人口、特に子供が多かったから育児対策費が多かったんじゃないの?」という逆の因果関係のほうがもっともらしいかもしれません。また、他の要因によって影響が出ているかもしれないので、因果関係をみつけるのことは難しいのです。

「え、それじゃ統計分析をやる意味がないじゃん!」と思われる方もいるのではないでしょうか。そこで、今回はこの問題に関する解決方法、すなわち因果関係を正確にとらえるための方法についてお話したいと思います。

Yが変化しても変わらないデータを選択する

ひとつは、Xに入れるデータは、絶対にYが変化しても変わらないデータを選択するという方法です(専門用語で外生変数となるXを見つけることです)。例えばYにある飲食店の売上、Xに気温を入れることでその飲食店が気温でどの程度売上に影響を受けるかを分析したとします。

このとき、この飲食店の売上が変化しても、その地域の気温には影響を与えられないことは常識的に考えるとそうなると思われます。つまり、この場合においては、「気温は売上に影響を受けない」という意味で外生変数となるのです。

学術的な理論によってその関係を説明する

ふたつ目の方法は、これも統計学の話から少し逸れてしまうのですが、何らかの学術的な理論によってその関係を説明する根拠を持ってくることです。例えば、マクロ経済学で出てくる「ケインズ型消費関数」というものがあります。ケインズ型消費関数は一国経済全体の消費と可処分所得(GDPから税金や補助金を差し引きして求められる、家計が自由に使える所得額)との間に正の相関があることを示したものです。

つまりケインズ型消費関数は可処分所得が増えると、一国経済全体の消費が増えるという因果関係を表すものになります。実際データを取って回帰分析を行うと、概ねこの関係を見て取ることができます。しかし、もしケインズ型消費関数という理論モデルがないとすると、私達はこの関係から「ああ、消費が増えると自分たちの可処分所得が増えるんだな」と逆の解釈をすることも考えられます。逆の解釈をさせないために、理論という別の根拠を持ってくることで対応をします。

次回は少し統計学の技術的なお話を

今回も少し難しい話で、かつ統計学の話から逸れてしまいました。次回は少し統計学の技術的なお話、具体的には回帰分析の応用事例として、最小自乗法を使うとまずいケースとその対処法についてお話したいと思います。

この記事を書いた人