Как бы вы рассчитали рейтинг фильмов IMDB? - PullRequest
4 голосов
/ 15 сентября 2010

Я делаю это только для учебных целей. Я не собираюсь менять методы IMDB.

Я спросил себя, владею ли я IMDB или подобным сайтом. Как бы я вычислил рейтинг фильма?

Все, о чем я могу думать, это Средневзвешенное значение (что является ничем иным, как Среднее арифметическое )

Для данных фильма, представленных ниже, вычисление будет

(38591 * 10 + 27994 * 9 + 32732 * 8 + 17864 * 7 + 7361 * 6 + 2965 * 5 + 1562 * 4 + 1073 * 3 + 891 * 2 + 3401 * 1) / 134434 = 8,17055953

alt text


Мой рейтинг 8.17055953 не совпадает с рейтингом IMDB (= средневзвешенное значение). Поэтому я пришел к выводу, что я что-то здесь упускаю или мой результат не является идеальным. Мне может быть не хватает многих вещей.

  1. Что не так с моим счетом? Почему это не идеально?
  2. Если бы вам пришлось вычислять. Как бы вы это сделали?

Ответы [ 2 ]

7 голосов
/ 15 сентября 2010

Не совсем по теме, но полезно для вас:

Как рассчитывается рейтинг.

надеюсь, что поможет

P.S. это подтверждается на этой странице:

Диаграмма IMDB

4 голосов
/ 15 сентября 2010

Сначала: ваш расчет (который является un средневзвешенным или просто средним) имеет опечатку: у вас 19562 '4' рейтингов, но вы должны иметь 1562. Исправление дает ~ 8,17, что округляет до среднего арифметического IMDB '.

Далее, если вы хотите получить средневзвешенное среднее, вам нужно что-то взвесить! Так, например, если у пользователей есть «репутация» или подобное (даже просто зарегистрированное время), вы можете использовать это как множитель для веса их рейтинга. В конце разделите сумму весов, а не общее количество голосов, и вы получите средневзвешенное значение.

Вероятно, понадобится некоторый масштабный коэффициент для веса - например, если SO сделал что-то подобное, то, по мнению Джона Скита, было бы немного несправедливо переносить двести тысяч раз вес Мнение недавно зарегистрированного пользователя:)

...