Совместная фильтрация с использованием категориальных функций - PullRequest
0 голосов
/ 27 апреля 2018

Я пытаюсь построить систему рекомендаций, используя совместную фильтрацию. Проблемы, с которыми я сталкиваюсь:

  1. Набор данных User-Item имеет в основном категориальные переменные, поэтому не может найти лучший способ для вычисления матрицы подобия. Евклидово / косинусное расстояние здесь не сработает, пытаясь с расстоянием Жакара.
  2. Набор данных не имеет пользовательского рейтинга для предметов, вместо этого у нас есть классификаторы - "не купил", "купил", "добавлен в корзину, но не купил".

Мы использовали XGB, чтобы получить вероятность покупки определенного элемента определенным пользователем, но такой набор данных не помогает при рекомендации.

Можете ли вы предложить какой-либо алгоритм рекомендаций (желательно на python), который обрабатывает классификацию и категориальные данные?

Заранее спасибо.

1 Ответ

0 голосов
/ 04 мая 2018

Майнинг правил ассоциации будет полезен здесь. Он рассчитывает относительную вероятность того, что элементы появятся вместе в истории пользователя. Он отличается от методик рекомендации совместной фильтрации и по-другому полезен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...