У меня есть набор данных movielens. Я хочу сделать иерархическую кластеризацию по файлам ratings.csv и movies.csv. Я пытаюсь понять шаги, как двигаться дальше логически. Итак, у меня есть 18 действительных жанров в наборе данных. Если у пользователя есть определенные предпочтения к уже просмотренным фильмам, как порекомендовать пользователю фильмы, которые он не смотрел. Я понимаю, что это означает, что мне нужно кластеризовать пользователей в соответствии с моими жанрами, которым они дали хорошие оценки, и посмотреть, к какому кластеру они относятся. Наконец, давая им рекомендации по фильмам, которые они еще не смотрели. Кто-нибудь может предоставить пошаговое руководство для достижения этой цели?