Как рассчитать сходство между категориальными переменными в совместной фильтрации - PullRequest
0 голосов
/ 14 октября 2019

Я пытаюсь создать систему рекомендаций с использованием совместной фильтрации.

  1. У меня есть набор данных пользовательских элементов. Я не могу найти сходство между похожим пользователем, так как я не могу использовать евклидово / косинусное расстояние, здесь работать не будет.
  2. Если я преобразую категориальную переменную в 0, то 1 не сможет рассчитать расстояние. Можете ли вы предложить какой-либо алгоритм рекомендаций в Python, который обрабатывает категориальные данные.

1 Ответ

0 голосов
/ 14 октября 2019

Вы все еще можете рассчитать сходство косинусов для набора данных элементов пользователя.

В качестве примера;пользователь 1 покупает элемент 1, элемент 2

пользователь 2 покупает элемент 2, элемент 3

Затем пользовательские векторы:

пользователь 1 = [1, 1, 0]

пользователь 2 = [0, 1, 1]

И косинусное сходство будет 0.5

Те же правила применяются к элементам.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...