静岡県の未来はどうなる!? オープンデータを用いた都道府県別の未来予測

地域にも利用可能なデータが存在する

GDPや消費者物価指数(CPI)など、国単位の経済指標の予測は、国全体の経済動向を占う上で重要です。しかし、国全体としては明るい見通しが出ていたとしても、地域単位では経済の未来が危ぶまれていることを見落としてしまう可能性もあります。

そのようなリスクに対して、何か対処する術は無いのか。今回は筆者の出身地である静岡県を取り上げ、都道府県別の経済予測ができるのかについて、検証してみたいと思います。

「地域に経済データって存在するの?」と思われる方もいるかもしれませんが、実は、地方においても代表的な経済指標などは存在しています。国単位のデータと比較すると得られる指標の数は限られてしまうのは事実ですが、地域のデータも実は多く存在しています。以下では、静岡県のデータについて見ていきたいと思います。

静岡県の未来を予測する

静岡県のデータは、静岡県公式ホームページ内の「統計センターしずおか」というサイトにあります。このサイトでは、以下のデータが取得可能です。

  • 静岡県推計人口
  • 静岡県鉱工業指数
  • 静岡県名目賃金指数
  • 静岡県景気動向指数(先行指数、一致指数、遅行指数)
  • 静岡県民総生産(国でいうところのGDP)

サイトから入手できるデータは、月次では1指標あたり20強ほどのサンプルサイズとなります。やや少ないですが、何とか分析できる量です。

その他にも、例えば消費者物価指数(CPI)は、地域のデータを総務省統計局が扱っておりますが、このように国が取り扱っている地域のデータも一部存在します。

  • 静岡市消費者物価指数(CPI)(※1)

一方で、やっかいな問題があります。それは、最新データが発表されるタイミングです。ほとんどのデータは数ヶ月前のデータしか公表されておらず、今回の分析(2014年10月14日現在)に使えるのは2014年7月までの発表値です。これを用いて予測をすると、2014年8月の値、すなわち「まだ発表はされていないが、過去の経済状況を表わす値」の予測となってしまい、「静岡県の未来を予測する」にはふさわしいとは言えません。

そこで、打開策のひとつとして、今回は「まだ発表はされていないが、過去の経済状況を表わす値」でも未来予測に使えるようにするために、景気の先行きを表すと言われる鉱工業指数(※2)の予測を行なうことにしました。

分析内容 ─過去のデータの性質から未来を予測する─

今回分析に用いるデータには、上述の静岡県民総生産以外の指標を用います。(静岡県民総生産は四半期データであるため、今回の分析に用いることは出来ません)

分析の手法には、シンプルで理解しやすい重回帰分析を選択します。また、未来予測をするためにはラグ変数を用いる必要があるため、説明変数はすべてラグ変数としました。各変数のラグ変数の中から、目的変数である静岡県鉱工業指数と特に相関関係の強いラグ変数を統計ソフトで自動で抽出して、説明変数としました(※3)。

分析結果 ─景気の波を感じさせる結果に─

それでは、分析結果について見ていきたいと思います。

静岡県の未来はどうなる!?
※相関している確率が赤色が有意な変数(相関している確率が95%以上ならば有意と定義)

まずは予測モデル全体の精度を確認するため、方程式の精度という値に着目します。これは100%に近づくほどモデルの精度が良いことを表わします。今回は96.87%となっており、まずまず高い精度のモデルとなりました。

次に、各指標の影響力と相関している確率を見てみると、影響力は、変数によって大きく影響しているものと僅かにしか影響力がないものがありましたが、それぞれの相関している確率に着目すると、採択された変数はほぼ80%以上の確率で相関しており、相関関係が高いことがわかります。

もう少し具体的に分析結果を見ていきましょう。

影響力に着目すると、符号がプラスのものとマイナスのものがあります。プラスの説明変数は、説明変数が上がると鉱工業指数も連動して上がると解釈でき、マイナスの説明変数は逆の動きをすることを意味しています。

プラスの影響力だったものは、「静岡県CI先行指数(1期前)」「静岡県人口(1期前)」でした。これらのうち、「静岡県CI先行指数(1期前)」に着目してみると、変数が上がると鉱工業指数が上がる、すなわち景気の状態が上向くというのは、なんとなく私たちの直感に合っている分析結果と言えます。

一方、マイナスの影響力だったものは、「静岡県名目賃金指数総額(2期前)」「静岡県CI遅行指数(2期前)」「静岡県人口(4期前)」「静岡県人口(9期前)」でした。これらのうち、「静岡県名目賃金指数総額(2期前)」「静岡県CI遅行指数(2期前)」に着目してみると、解釈としてはこれらの変数が上がると鉱工業指数が下がる、すなわち景気の状態が悪化することを意味しています。これらは、私たちの直感に合いません。たとえば、静岡県名目賃金指数総額がマイナスの影響力だというのは、賃金が下がると景気が悪くなる、ということを意味します。これってすごく直感と合わないですよね?しかしながら、分析結果としてはこのような結果となっています。

では、この場合どのように解釈するのが良いのでしょうか?

この分析結果の背後に潜む要因として、景気の波(景気循環)が考えられます。景気の波は、あらゆる社会で存在しており、景気が上向いたり下降したりしています。ということは、マイナスの影響力が出ている説明変数においては、説明変数がラグ変数であるために、数ヶ月単位の景気の波が存在している、すなわち数ヶ月前に景気が良い(悪い)と今は景気が悪くなる(良くなる)という波が存在しているかもしれない、ということです。本当に景気の波といえるかどうかについては、より綿密な分析した上で検証することができますが、今回の分析によってその可能性を示唆することが出来ます。

続いて、今度は推計値と実測値を比較してみましょう。

静岡県の未来はどうなる!?
※ここでは、信頼区間を標準誤差(※4)±2以内の区間と定義しています。通常、この標準誤差±2の間にほとんどの値(約95%)のデータが入るとされています(※5)。すなわち、信頼区間外の値であると、実測値と推計値の誤差が大きく、推計値の精度が良くないと判断します。

推計値と実測値は、あまり差がありませんでした! トレンド(前月の値から上がったか下がったか)に関しては、15期中4期のズレがありましたが、ほとんどの箇所が前月よりも乖離幅が狭くなっており、トレンドは異なっていてもそれほど悪い結果ではないと判断できます。乖離に関しては、全て信頼区間内に収まり、良好な分析結果だったと言えます。

そして、このモデル式を用いて2013年8月の鉱工業指数を予測したところ、【92.8】となりました。この結果は前月よりも少し高い値となっておりますが、果たしてどの程度当たるのでしょうか?結果が楽しみです。

地域単位のデータだけでも地域経済指標予測は可能!

今回の結果から、地域単位のデータのみを使用しても、地域経済予測が可能であることが分かりました。現在、世界的にデータのオープン化は様々な形で進行していますが、今後オープンデータ化が浸透していくことで、より多くの指標予測をより高い精度でできるようになることが期待できます。

現状では、都道府県によって公開データの量は多少誤差はあるとは思いますが、どこの都道府県もある程度の指標を公開しているので、ぜひ他の都道府県で同じような未来予測を試してみてください。

※1:CPIは都道府県単位での指標はなく、各地方の主要都市の指標を発表しているため、今回の分析では静岡県の値を表すものとして、静岡県の県庁所在地である静岡市のデータを用います。
※2:鉱工業指数にもいくつか種類がありますが、今回使用したのは最も頻繁に使われる「鉱工業生産指数」を使用しました。
※3:その際、多重共線性が発生しないような組み合わせとなるよう留意しました。
※4:実測値と推計値の誤差の平均値を示します。
※5:正規分布を仮定した場合。

この記事を書いた人