Предположим, что пользователь голосует за некоторые фильмы в масштабе от 1 до 5. Эти фильмы имеют информацию о жанре, и фильм может иметь более одного жанра.Вот так:
Movie A Rating 4
Action/Sci-Fi
Movie B Rating 5
Comedy/Action
Movie C Rating 4
Comedy/Drama
Мы хотим узнать, какой жанр нравится нашему пользователю.Здесь у нас есть набор результатов:
Genre Movie_Count Average_Rating
----------
Action 2 5
Comedy 2 4.5
SciFi 1 4
Drama 1 4
Очевидно, что мы не можем ничего предсказать с таким небольшим набором результатов, но давайте предположим, что у нас больше набор данных.как мы можем отсортировать наиболее любимые жанры этого пользователя?Просто рассчитать средневзвешенное значение или что-то более сложное?