Я пытаюсь построить систему рекомендаций, используя совместную фильтрацию. Проблемы, с которыми я сталкиваюсь:
- Набор данных User-Item имеет в основном категориальные переменные, поэтому не может найти лучший способ для вычисления матрицы подобия. Евклидово / косинусное расстояние здесь не сработает, пытаясь с расстоянием Жакара.
- Набор данных не имеет пользовательского рейтинга для предметов, вместо этого у нас есть классификаторы - "не купил", "купил", "добавлен в корзину, но не купил".
Мы использовали XGB, чтобы получить вероятность покупки определенного элемента определенным пользователем, но такой набор данных не помогает при рекомендации.
Можете ли вы предложить какой-либо алгоритм рекомендаций (желательно на python), который обрабатывает классификацию и категориальные данные?
Заранее спасибо.