入門「統計」のお部屋

わかりやすく「統計」についてお話します。

【統計】食べログの点数って本当?を検証してみる①(京都 カフェ/喫茶店)

はじめに

 昨年は、食べログの点数って本当?っていう話題が盛り上がった一年だったかと。

 流れを簡単におさらいした後、この記事では、京都市のカフェ・喫茶店を対象として食べログの点数を検証してみます。 

 

昨年に流行った記事

 食べログ問題の発端はこの記事かな?

 「評価3.8以上は年会費を払わなければ3.6に下げられる」のは本当?ということを調査すべく、点数を集計した結果、

  • 3.8 を超える評価は極端に少ない
  • 3.6 付近の評価は異常に多い

という偏りがあることを見出されている。

clean-copy-of-onenote.hatenablog.com

 

 その後、togetterで盛り上がっていたりもする。

togetter.com

 

 食べログの点数に関して、昨年末にもこんな記事が。こちらはお店の人の声で、急に点数が下げられたとの主張。

 お店の客数が食べログの点数で左右されるので特に小さいお店は死活問題なのかもしれない。

 一方、食べログ側としても点数はビジネスのキモなので、一筋縄ではいかない様子が見受けられる。。点数の基準を未だに明らかにしてないしね。まぁGoogleの検索の順番も基準を明らかにしてないけど。。

www.yomiuri.co.jp

 

食べログさんがお金で点を調整しているかはわからない、けれど。

 食べログの運営が、お金による点数の調整をやってるかはわかりませんが、企業の収益を最大化するためには、点数とお金とセットにするという手法はみんな思いつくでしょう。

 さらに、「3.8」以上は年会費を払わないと「3.6」に下げられるとするならば、これら「3.8」や「3.6」という点数はよくできた値だなぁと。

 3.8以上なら明らかに高いと思えるので、お店側からは欲しい点数。

 しかし、3.6でも十分以上には高いレベルなのですぐに強いクレームを出すほどでもない。

 

 個人的には、食べログの点数は参考程度で、行くか行かないかはコメントをざーっとみてお客さんの質によって判断しているなぁ。個人的に好みなお客さんが好んでいるお店ならいいんだろうと。文体での判断。

 しかも、コメントの質は高く各レビューの点も高いのに、総合点数が低く、行ってみたらとてもいいお店だったときは穴場発見でとてもうれしくなるというおまけつき。 

 

 ということで、一度、自分でも食べログの点数を分析してみようかと。

 データ的に面白いものが見いだせれば嬉しいし、知らなかった店を抽出できるとさらに良い。

分析対象

 京都市内のカフェor喫茶店

 点数上位250店舗について、点数と評価数を抽出。

  

点数の抽出(スクレイピング)参考サイト

 スクレイピング(ざっくりいうと、ネット上のデータを収集する手法)には、こちらのサイトのコードを活用させていただきました、、大感謝。

qiita.com

 

最初の分析:食べログ ヒストグラム 

 ヒストグラムとは、横軸に数値、縦軸のその数値の数を示すグラフ。

 今回の例だと、横軸に食べログの点数、縦軸にその点数範囲内にあるお店の件数です。

 対象は、「京都市内」の「喫茶店、カフェ」。合計250軒。

f:id:kohei327:20200105002908p:plain



 

 このデータを見ると、2つ壁がありますね。。

 一つは、3.1と3.2の間。

 もうひとつは、3.6と3.7の間。。

 

 3.6と3.7の間は、最初に紹介した記事と合わせるとちょっと違和感ありますね。。

 お金を払わないと3.6に下げられるという話は本当なのか。

 

 3.2~3.8までの点数が、同じトレンドで移行するとしたら、3.6だけ高くなっているのは、3.7以上の山をムリヤリ3.6に積んだともいえなくはない。

 

 ともあれ、この偏りに関しては答えがでない、、ので、別のデータとしてGoogle Mapの点数と比較してみます。

 

食べログの点と、Google Mapの点を比較してみる

 横軸に食べログ、縦軸にGoogle

 Googleの値は手でスクレイピングしました。。よって、対象は50軒に絞ってます。

 ちゃんと相関があれば右上がりの点になってほしいところですが左上と右下になっている、、。あまり関係がないという印象。

 どのくらい関係があるかという指標の一つであるR2(自由度調整済み決定係数という値)も、0.0033と非常に低い。この数字は1~0という範囲内。グラフからみて計算する意味はもうないけど、、、という低いレベル。

 

f:id:kohei327:20200103232502p:plain

 

何で京都のカフェにしたの?

 理由は簡単、京都近辺に住んで9年程度、カフェにはそれなりに行ったことがあるからです。

 よって、自分の肌感覚で食べログGoogleの点数と、実際のお店を比較できるから!

 

 このトップ50軒中、訪問したことがあるのは15軒でした。ちょうど30%。

 まぁ、京都市内トップのカフェ30%行ったことがあるという人はそこまで多くないんじゃないか、と信じることにして、この先の分析を進めます。

 

 ・・・はい、せっかくなのでのこりのお店も着々と訪問してみます。

 

お店の名前を追加してみる

 上のデータにお店の名前を載せてみました。

f:id:kohei327:20200103233457p:plain

 

 もし食べログが、お金を払わないと3.6以下にするぞーをしている場合、いいカフェに行きたいとしたら、3.6以下でGoogleの評価が高い店に行くべし!となる。

 その観点でいうと、Magさんがベストか!?次に面白そうなのはKurasuさん。

 

tabelog.com

 

tabelog.com

 

 magさんは、オープン直後から通っていて、その頃は食べログのコメントはゼロでほんまにいい隠れ家を見つけたなーと頻繁に訪問させて頂いておりました。

 まずコーヒーがおいしい、そしておしゃれ、さらにゆったりできる。

 いやぁマジもう間違いないお店。

 

 Kurasuさんは、行ったことないです。。

 ただ、口コミが1000件弱でGoogleこの点数、行くしかない!

 

 あと目立つのは、右側にある喫茶葦島さんとElephant Factory Cafeさん。この2軒は10回以上ずつ通っている。クオリティの高さ、間違いなし。

 

ここまでのまとめと次のステップ

 まとめると

  • 食べログはお金を払わないと3.6に叩き落されるという噂
  • 京都市内の喫茶店/カフェを調べると、なぜか3.6にピークが立っている
  • Google Mapの点数との相関関係は無い

ですかね。

 

 次のステップとしては

ですね。

 

 出てくるお店の30%は訪問したことがあって、残りも見たことがあるお店が多いという肌感覚を持っている立場として、数字の分析も進めていきます!

最後に、そもそもの話

 例えばなにか気になるニュースがあった場合に、

  • そのニュースが本当なのか?
  • 違った見方ができないか?
  • 危ないとしたらどのくらい危ないのか?

といったことを、データを使ってサッと確認できると便利。

 データで確認なんて毎回やっていられない!と感じられるかもしれませんが、慣れてくると、ちょっと見ただけで「違和感」を感じ取れるようになります。

「違和感」のあるお話は、眉につばをつけて読んで(聞いて)、必要に応じて自分で確認するというサイクル。

 もちろん仕事でも役立ちます。「データをロジカルに分析して定量的に結論を出すというスキル」があれば、

  • 給料やボーナスが増える
  • 圧倒的短時間で成果が出る
  • みんなから一目置かれ、頼りにされる

など、メリットしかありません。

 このブログでは、こういった統計的なお話をドンドンしていきたいと思いますのでぜひお読み頂けますと幸いです。

 知りたいことがもしあれば、ここのコメントに記載頂いてもいいですし、下のアドレスからメールにてご質問頂いてもご回答させて頂きますので良かったらぜひ。今ならキャンペーンでプレゼントもご用意しています。

 

キンドル本と動画セミナープレゼント

メルマガではブログでは非公開の情報を公開中です。更に知りたい場合は登録してください。

詳しくはこちら

f:id:kohei327:20191002002342j:plain

キンドルで発売中のこちらの本もプレゼント中!