Поиск наиболее понравившегося товара пользователя со значениями рейтинга - PullRequest
0 голосов
/ 07 февраля 2012

Предположим, что пользователь голосует за некоторые фильмы в масштабе от 1 до 5. Эти фильмы имеют информацию о жанре, и фильм может иметь более одного жанра.Вот так:

Movie A Rating 4
Action/Sci-Fi

Movie B Rating 5
Comedy/Action

Movie C Rating 4
Comedy/Drama

Мы хотим узнать, какой жанр нравится нашему пользователю.Здесь у нас есть набор результатов:

Genre Movie_Count Average_Rating

----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4

Очевидно, что мы не можем ничего предсказать с таким небольшим набором результатов, но давайте предположим, что у нас больше набор данных.как мы можем отсортировать наиболее любимые жанры этого пользователя?Просто рассчитать средневзвешенное значение или что-то более сложное?

1 Ответ

1 голос
/ 07 февраля 2012

Основная проблема, которую я вижу здесь:

Пользовательский рейтинг 1000 комедийных фильмов со средним баллом 4

Пользователь оценивает 10 боевиков со средним баллом 4,1

Как вы их заказываете?

См. http://www.evanmiller.org/how-not-to-sort-by-average-rating.html для обсуждения и одного возможного решения.

Другая проблема будет:

Если фильм и комедийный, и боевик, и ему присвоен рейтинг 4,0, сколько это будет стоить, потому что это комедия или боевик?

Вы можете решить эту проблему, используя максимизацию ожидания http://en.wikipedia.org/wiki/Expectation%E2%80%93maximization_algorithm.

...