ブログ

決定係数とは?

決定係数とは何か?

回帰分析を行う際、導かれた回帰直線は、当てはまりの良いものもあれば当てはまりの悪いものもあります。

決定係数とは?

この回帰直線のフィット具合(当てはまり具合)を客観的に示す指標が決定係数です。決定係数は0から1の範囲内の値を取り、1に近ければ近いほど回帰直線のフィット具合が良いとされ、0に近ければ近いほど回帰直線のフィット具合が良くないと判断します。この数字は、回帰分析をした結果、平均からの誤差がどれだけ小さくなったか(言い換えれば、説明変数によってどれだけ説明されたか)を表しています。

重回帰分析における決定係数(重決定係数)

一方、重回帰分析においても決定係数は存在します。例えば、説明変数が2つの場合を見てみましょう

決定係数とは?

この場合、2次元だった回帰分析とは異なり、3次元の空間に点が宙に浮いている状態となります。重回帰分析は、これらの宙に浮いている点の傾向を表す面(これを回帰面という)を挿入するイメージです。説明変数が3つ以上の場合は、4次元以上の空間となって図示で表すことはできませんが、このような「傾向を表す面を挿入する」というイメージは変わりません。

では、重回帰分析における決定係数(重決定係数)とはどのようなものでしょうか?これは、回帰面によってどれだけ説明できているかを表しています。先ほどの2次元の回帰直線の場合と同じように、誤差が小さくなる(説明変数によって説明できる範囲が増える)ほど決定係数は大きくなります。

実質的なフィット度を表す「自由度調整済み決定係数」

ここまで回帰分析および重回帰分析における決定係数について説明してきましたが、これらは名目的なフィット度であって、実質的なフィット度ではありません。この実質的なフィット度を表しているのが、自由度調整済み決定係数です。自由度調整済み決定係数は、文字通り自由度を考慮して調整された決定係数です。

自由度が小さいデータの回帰直線は根拠が信用しづらいと判断されるため、自由度調整済み決定係数は通常の決定係数に比べて下がります。一方、自由度が大きいデータの場合は十分な根拠となると判断され、自由度調整済み決定係数は通常の決定係数に比べてあまり下がりません。

ちなみに、通常の決定係数は0から1の値を取りましたが、自由度調整済み決定係数はマイナスの値も取り得ます。もともとの決定係数が0に近く、且つ自由度が小さい場合にマイナスとなることがあります。

決定係数で分析の良し悪しは決まらない

最後に、決定係数に関して気をつけなければならない事があります。それは、決定係数はあくまで回帰直線のフィット度を示しているだけであり、分析の良し悪しを示すものではないということです。決定係数が高いから「良いモデル」、低いから「悪いモデル」ということは言えません。したがって、決定係数がどれくらいあれば良いという目安なども存在しません。

この記事を書いた人