統計学コラム

ラーメン屋の「口コミランキング」と「価格」の関係|メノコメトリックス

口コミランキングがあがると、ラーメンの値段は高くなる、低くなる? 日常のちょっとした疑問、誰かに話したいネタも統計で分析できるんです!

(この記事は、2014年に公開した記事を一部編集したものです)

ラーメン屋の「口コミランキング」と「価格」の関係

ラーメン屋を探索するのに、食べログランキング等の口コミ情報を参考にしています。
最近のラーメンは、600円前後が相場でしょうか。一杯1,000円を超えるメニューも珍しくはありません。
そこで気になるのが、「口コミランキングと価格って相関するのだろうか」。すなわち「人気の高いラーメン屋ほど値段は高くなるのだろうか?」ということです。

感覚では口コミランキングと値段の間には相関関係がないように思えますが、分析してみなければ分かりません。
ラーメンの激戦区として有名な高田馬場の「食べログランキング」上位20位のラーメン屋を選択し、実際に分析してみることにしました。なお、各ラーメン屋の代表的なラーメンの値段として、一番安いラーメンの価格を採用しています。

(データ参照元:食べログ|高田馬場 ラーメンランキング ※本記事で使用したデータは、2014年執筆時のものです。リンク先は現時点のものとなります)

ランキングが高いほど価格も高い…?

データが揃ったところで、早速回帰分析してみました。その結果が以下の図です。

「メノコメトリックス」でデータを俯瞰する

回帰直線は右下がりの曲線を描きました。これは、ランキングが上がるとラーメンの価格が平均的に高くなることを意味しています。
傾きが-5.1654なので、これはランキングが一つ上がると価格が平均的に5.1654円高くなることを意味しています。

しかし、データをよく観察してみると、データの分布は10位前後の値段が最も高く、逆U字を描くような分布となっていることが見てとれます。そのため、回帰直線も有意ではなく、データの性質を表していないような気がします。
このような観察を踏まえ、「データは10位以内と11位以降では特性が異なるのかもしれない」。すなわち「11位以降は口コミログランキングが高ければ高いほど値段は高くなるが、10位以内は口コミランキングが高ければ高いほど値段が低くなる傾向があるのではないか」と仮説を立てました。

この仮説に基づき、続いてはデータを二分して10位以内のデータと11位以降のデータで分析してみます。

10位以内と11位以降の比較

「メノコメトリックス」でデータを俯瞰する

予想通り、10位以内は右上がり、すなわち10位以内ではランキングが上がれば価格が下がるという傾向値になり、対照的に11位以降は右下がり、すなわち11位以降ではランキングが上がるほど価格が高くなるという傾向値となりました。
係数の有意性に着目すると、11位以降は有意な値でしたが、10位以内は有意な値ではありませんでした。しかしながら、決定係数を比較するとどちらも全体のデータを用いて分析した際の決定係数より改善しているため、データを二分して分析したことは適切であったと言えます。

「メノコメトリックス」がいかに大事か

データを分析する場合、基本的には、仮説の設計、目的変数の設定、データ収集、データ整理、データ分析、というプロセスを辿ります。
しかしながら、そのプロセスを踏む際に気をつけてほしいことが一つあります。
それは、「分析する際にデータを観察してみる」ということです。具体的には、欠損値や異常値が無いかを探してみたり、データの分布を見たりすることです。
この「分析する際にデータを観察してみる」という行為を、しばしば「メノコメトリックス」と言います。これは、計量経済学を表すエコノメトリックスをもじったもので、まずはデータを「目」で見てみようということで、「メノコ(目の子)メトリックス」と言われています。

層化 〜メノコメトリックスで、データを切り分ける〜

さらに、データの性質ごとに適切に分けることを「層化」といいます。
例えば、ある学年の身長を算出する際、男女をごちゃまぜの状態で観察すると、男性の平均値まわりと女性の平均値まわりの分布が多くなることが予想されます。
その場合、度数分布表(ヒストグラム)で表すと峰が2つある状態(双峰型)となりますが、こうなると統計処理の際に様々な不都合が起こるので、このような場合にも層化して2つに分ける必要があります。

今回のラーメン屋での分析で行ったのも、まさにこの「層化」という方法です。これにより、10位以内と11位以降では傾向値が違う、という仮説を確認することが出来ました。

「メノコメトリックス」でデータを俯瞰する

層化だけではない、メノコメトリックスの重要性。

今回は、層化を通じたメノコメトリックスの重要性について説明しました。
メノコメトリックスから分かることは、層化すべきデータだけではありません。外れ値を発見したり、データ全体の傾向値を把握したりする際にも有効です。これらは、Excelに数値データとしてあるだけでは分かりづらく、プロット図などに表す等してビジュアル化することによって発見しやすくなるのです。

また、メノコメトリックスは、可能であれば分析する前に行った方が良いとされています。そうした方が、適切な分析手法に早道でたどり着けるからです。逆にメノコメトリックスをしないまま分析してしまうと、ミスリーディングな結果となってしまう恐れがあります。そのため、とりわけ綿密に分析した場合は、まずはメノコメトリックスを行ってデータの全体像を見てみると良いと思います。