『岡山レビュア20名口コミ数毎単純平均(正規化後)』グルメマップコレクターさんの日記

レビュアーのカバー画像

岡山・香川のランチはレジャー!

メッセージを送る

グルメマップコレクター 認証済

日記詳細

日頃から食べログを見ていると自分の感覚と異なる点の動きに首をかしげる
こともままある訳ですが、じゃあ自分で計算してしまおうと(笑)。

今回以下の方法で集計しました。

(1)岡山へのレビュー数の多いレビュア20名の岡山への口コミを抽出。
                       (勝手にデータをコピペしてすいません)
(2)レビュア毎店舗毎に昼の点数と夜の点数の高い方Xを計算。
(3)レビュア毎に平均点μと標準偏差σを計算。
(4)レビュア毎店舗毎の点数をY=(X-μ)/σ+3で正規化。
(5)店舗毎にYの単純平均を計算

口コミ数が1の店舗は除いて、口コミ数を横軸に、Yの単純平均を縦軸に
散布図を描いたものが画像です。

例えば大好きなやな木の場合、岡山レビュア20名のうち8名が口コミを投稿
していて、その8名のYの単純平均が5.037となります。

このグラフを見ると口コミ数が増えるごとに、ばらつきが少なくなっているのが
分かりますね。食べログで口コミが少ないうちは点が上がらないようにしている
理由がここにあります。ちなみに口コミ数が1の店舗を除いたのも同じ理由。

私が考えるいいお店というのは、Yの単純平均が高いお店ではなく、口コミ数が
増えていくとばらつきが減っていくのに、それに逆らって突出してYが高いお店、
つまり集団からの飛び出し具合が大きい(同じ口コミ数の集団の標準偏差に
対する倍率が大きい)お店です。

ね、やな木はもっと点が高くなってもいいと思いませんか?(笑)

ちなみに口コミ数毎に点数の高いお店は以下のようになっています。

口コミ数2:あづまや
口コミ数3:穂浪銀座
口コミ数4:ファニエンテ
口コミ数5:寿ひさ田
口コミ数6:レオーニ
口コミ数7:タマちゃん
口コミ数8:やな木
口コミ数9:インダストリー

ここから先はサンプル数も少ないのでおまけですが、以下のような感じ。

口コミ数10:かめや
口コミ数11:海一じくや
口コミ数12:うどん村
口コミ数13:とも作
口コミ数14:山下商店
口コミ数15:ルーアン

他にもいろんな見方ができて、当分遊べそうです。行ってみたくなった
お店もいくつかでてきました。その中でもグレイスさん、口コミ数2だけど
突出して高い点数です。食べログの点数だと岡山で240位ですから普通に見てたら
気づきませんでした。この方法の方が感度が高い場合もあるということです。

やってみてよかった!

初稿'13/05/28
ページの先頭へ