日頃から食べログを見ていると自分の感覚と異なる点の動きに首をかしげる
こともままある訳ですが、じゃあ自分で計算してしまおうと(笑)。
今回以下の方法で集計しました。
(1)岡山へのレビュー数の多いレビュア20名の岡山への口コミを抽出。
(勝手にデータをコピペしてすいません)
(2)レビュア毎店舗毎に昼の点数と夜の点数の高い方Xを計算。
(3)レビュア毎に平均点μと標準偏差σを計算。
(4)レビュア毎店舗毎の点数をY=(X-μ)/σ+3で正規化。
(5)店舗毎にYの単純平均を計算
口コミ数が1の店舗は除いて、
口コミ数を横軸に、Yの単純平均を縦軸に散布図を描いたものが画像です。
例えば大好きなやな木の場合、岡山レビュア20名のうち8名が口コミを投稿
していて、その8名のYの単純平均が5.037となります。
このグラフを見ると口コミ数が増えるごとに、ばらつきが少なくなっているのが
分かりますね。食べログで口コミが少ないうちは点が上がらないようにしている
理由がここにあります。ちなみに口コミ数が1の店舗を除いたのも同じ理由。
私が考えるいいお店というのは、Yの単純平均が高いお店ではなく、口コミ数が
増えていくとばらつきが減っていくのに、それに逆らって突出してYが高いお店、
つまり
集団からの飛び出し具合が大きい(同じ口コミ数の集団の標準偏差に
対する倍率が大きい)お店です。
ね、やな木はもっと点が高くなってもいいと思いませんか?(笑)
ちなみに口コミ数毎に点数の高いお店は以下のようになっています。
口コミ数2:
あづまや口コミ数3:
穂浪、
銀座口コミ数4:
ファニエンテ口コミ数5:
寿、
ひさ田口コミ数6:
レオーニ口コミ数7:
峠、
タマちゃん口コミ数8:
やな木口コミ数9:
インダストリーここから先はサンプル数も少ないのでおまけですが、以下のような感じ。
口コミ数10:
かめや口コミ数11:
海一、
じくや口コミ数12:
うどん村口コミ数13:
とも作口コミ数14:
山下商店口コミ数15:
ルーアン他にもいろんな見方ができて、当分遊べそうです。行ってみたくなった
お店もいくつかでてきました。その中でも
グレイスさん、口コミ数2だけど
突出して高い点数です。食べログの点数だと岡山で240位ですから普通に見てたら
気づきませんでした。この方法の方が感度が高い場合もあるということです。
やってみてよかった!
初稿'13/05/28