ブログ

最小二乗法を使うとマズい場合

平賀です。今回で3回目になりましたが、苦痛を感じずに読むことはできておりますでしょうか。前回は相関と因果の違いについて話させていただきましたが、今回は最小二乗法を使うとマズい場合について、お話させていただきます。もしかしたら、少し技術的な話になってしまうかもしれませんが、できる限りわかりやすく説明するように心がけます。

最小二乗法とは

復習を兼ねてですが、最小二乗法の説明をさせていただきます。最小二乗法とは Y と X という2つ(ないしはそれ以上)の変数の関係を Y=a+bX という線の関係で表し、もっともらしい a と b の値を、データを使って推定するというものです。

最小二乗法とは

ただ、最小二乗法の妥当性については留意する点があります。それは、「 Y の理論値」と「 Y の実測値の差を2乗した値の合計」の差として表される残差が、ランダムに、すなわちバラバラに出てくることを仮定していることです。この仮定が崩れると、最小二乗法を使うとマズいことが起こってしまいます。以降、主たる2つのマズいことについて話させていただきます。

最小二乗法を使うとマズい場合

不均一分散

不均一分散

問題点

ひとつ目のマズいことは、残差のばらつき度合い(分散)がデータの値が大きくなることで変化してしまうという不均一分散が挙げられます。最小二乗法では、この残差の分散がデータの値に関わらず一定であるという均一分散を仮定しておりますが、この仮定が崩れると、マズいことが起こります。具体的には、推定された値が正しいかどうかをチェックするときに見る基準であるt値の値が信用できなくなるということが起こり、最小二乗法で推定された値を正しく評価することが難しくなってしまいます。

解決策

いくつか対応法がありますが、その中で代表的な分析手法を紹介します。不均一分散は、分散の変動と関係のある他の変数を用いて調整を行う一般化最小二乗法という方法で解決することができます。

系列相関

系列相関

問題点

ふたつ目のマズいことは、時系列データを用いるときに発生する問題として、ある期の残差とその1期前の残差との間に相関関係があるという系列相関という問題が挙げられます。最小二乗法では系列相関はないと仮定しておりますが、この仮定が崩れると、マズいことが起こります。具体的には、不均一分散の場合と同様に推定された値が正しいかどうかをチェックするときに見る基準であるt値の値が信用できなくなるということが起こり、最小二乗法で推定された値が妥当であるとは言えなくなってしまいます。

解決策

系列相関は、今期と前期の残差の相関を考慮して、再推計しなおすことで系列相関の問題を改善するというコクラン・オーカット法という手法があります。具体的な手法については、やや専門的な話になるのでここでは説明を割愛します。もしご興味のある方は入門レベルの計量経済学のテキストをご覧になっていただけるとよろしいかと思われます。

問題を改善する手法が考え出され続けている

今回の話は少し難しかったでしょうか。今回のブログでお伝えしたかったのは、難しいことを理解していただくことよりも、計量経済学ではさまざまな問題が発生してもそれを改善する手法が考え出され続けているということです。もちろん今回お伝えした手法についても問題点や改善策が多くの計量経済学者によって考え出されております。つまり、統計分析の分野では、より正確な分析手法が考え出され、より妥当な推定結果を得られるように日々進歩しております。

この記事を書いた人