syokuji_steak_man

1 2019/10/08(火) 22:52:54.29 ID:xXccg1PVM

食べログ3.8問題を検証


方法
食べログにアクセスして公開されている各店舗の評価を取得し、
評価の分布に異常な偏りが存在しないかを確かめます。

評価数が少ないと、小数のユーザーで評価点がバラついてしまうので、
一定以上の評価数がある店舗に絞って情報を取得します。

取得したデータ
試しに地域を大阪に限定して、
評価数が一定数以上ある店舗1200店舗について、
食べログでの評価点を取得しました。

下の図は、横軸を評価数、縦軸を評価点として、
データをプロットしたものです。



直観的には評価の数が多いほど評価点が高いイメージがありましたが、
グラフを見る限り、そのような傾向は見えませんね。

また、なんとなく、3.8付近に壁があり、
3.8以下は多いが、3.8以上は少ない様子が見えます。

この傾向をより正確にみるために、ヒストグラム化してみます。

評価点の分布
評価点に操作が加えられているなら、
特定の評価点に偏りが現れるはずです。

そこで、評価点がどのように分布しているかを調べます。

下の図は横軸を評価点、縦軸のその評価を獲得した店舗数として、
ヒストグラムを示したものです。




このグラフで注目したい特徴は以下の二つです。

評価3.8の前後で大きく傾向が変わる
評価3.6付近が異常に多い
評価3.8の壁
グラフを見ると、評価3.8までは、
その評価が付けられる店舗数が徐々に増えていますが、
3.8の直前でピークを迎えた後、
3.8を超える店舗は極めて稀になります。

評価3.8が壁として一つの天井になっていると言えます。

確かに、3.8以上を強制的に引き下げるという操作をしていれば、
このグラフに矛盾しませんね。

評価3.6が異常に多い
評価の高い店舗が少ないのは当然と言われればそうかもしれません。
ところが、3.8の壁以上にグラフで注目すべきは、
評価3.6付近が異常に多いことです。

3.6前後の評価は40店舗くらいにも関わらず、
その3~4倍の数の店舗が3.6付近の評価になっています。

明らかに全体の傾向から外れた異常な偏りです。

なるほど、3.8を超えた店舗を3.6に下げるような操作をすれば、
確かにこのような分布の偏りを矛盾なく説明できます。

まとめ
食べログの評価は「3.8を超えると3.6に下げられる」という話の真実性を、
食べログの評価の分布の偏りを調べることで調査しました。

結果としては、
- 3.8 を超える評価は極端に少ない
- 3.6 付近の評価は異常に多い
という話に矛盾しないような分布の偏りが認められることが分かりました


もちろん、これだけでは真相は分かりませんが、
他にこの奇妙な偏りを説明することは難しいように思います。

仮に本当に操作が行われていれば、
ユーザーからのリアルな評価が知れるという
口コミサイトの特徴を大きく損なってしまうため、
今後の利用方法を考え直す必要があるかもしれません。

https://clean-copy-of-onenote.hatenablog.com/entry/tabelog38_problem

関連記事:【絶望】食べログの ”闇” ガチで 深 す ぎ る wwwww




11 2019/10/08(火) 22:54:02.76 ID:xXccg1PVM
おまけ
大阪だけだと不安なので、
東京でも調べてみました。

下のグラフが東京の食べログ評価の分布です。


東京の食べログ評価

結果は同様ですが、東京の方がより傾向が明らかに見えます。 


13 2019/10/08(火) 22:54:25.88 ID:1UEJXRqgd
>>11
うーむ


94 2019/10/08(火) 23:01:42.90 ID:EWSAtFPE0
>>11
うーんこの断崖絶壁


133 2019/10/08(火) 23:04:07.12 ID:bX7m2BxTa
>>11
これは流石におかしい


260 2019/10/08(火) 23:11:02.58 ID:A1SreAIP0
>>11
露骨で草


537 2019/10/08(火) 23:30:04.31 ID:PxrBUwWld
>>11
こりゃひでーわww


17 2019/10/08(火) 22:55:31.67 ID:WaRUVufy0
3.6以上の店はアカンのか


22 2019/10/08(火) 22:56:30.14 ID:tdaOGMri0
>>17
ミカジメ料払ってるってだけで一概に悪いって訳ちゃうで


61 2019/10/08(火) 22:59:47.38 ID:IoX4RIir0
>>22
言うて3.6以上3.8未満は実力で3.8以上無いのが確実なんやろから結構悪いんちゃう?
少なくとも3.6に張り付いてるところよりは確実に悪そう


20 2019/10/08(火) 22:56:17.66 ID:uUK1r5RK0
一個一個調べてデータ集めたんか
暇人か




28 2019/10/08(火) 22:57:18.32 ID:n6OYxg210
>>20
webスクレイピングやろ


29 2019/10/08(火) 22:57:24.96 ID:YkW/riXF0
つーかそもそも食べログ側が数字弄っとるのは認めとるんやろ


32 2019/10/08(火) 22:57:57.46 ID:jTnQBMJP0
うおぉおおお!


34 2019/10/08(火) 22:58:02.43 ID:ij7zsK2i0
頼りになるのはGoogleの口コミだけやな

高級店はミシュランガイド


35 2019/10/08(火) 22:58:02.94 ID:wguvhggud
3.6を3.8以上にならしておくと正規分布なりそう


45 2019/10/08(火) 22:58:40.36 ID:1fdKMWjqp
チェーン店ばっか評価高いもんな


47 2019/10/08(火) 22:58:41.43 ID:4zVEPZ4Br
これ単純な平均を点数にしているわけではないから検証としては不十分すぎる


831 2019/10/08(火) 23:48:22.61 ID:WvpnbgQu0
単純に偏りがあることはなんの証明にもなってないやろ


893 2019/10/08(火) 23:52:47.56 ID:xf9CITWBd
まあでも結局デートする店探すには便利なんよな
googleとかキュレーションサイト見て普通に検索するのは探しにくいわ


780 2019/10/08(火) 23:45:01.12 ID:cEDNgVuCd
食べログとか営業時間調べるサイトやろ


9999 1234/05/06(月) 00:00:00.00 ID:ExAwArosU



これは…

     ∧_∧
   ( ´ω`) 
  (    )
   | | |
   (__)_)




引用元: http://swallow.5ch.net/test/read.cgi/livejupiter/1570542774/