Двоичные значения в совместной фильтрации - PullRequest
3 голосов
/ 29 декабря 2011

Могут ли значения в матрице User-Item быть двоичными значениями, такими как 0 и 1, которые указывают «не купил» -vs- «купил»? И если применить матрицу модели скрытого фактора, может ли прогнозируемое значение (например, 0,8) обозначать вероятность поведения пользователя (т.е. не покупал или не покупал)?

1 Ответ

1 голос
/ 11 января 2012

Да, для представления рейтингов достаточно неявной обратной связи. Одна небольшая ловушка с предложением, которое вы сделали, было бы, если 0 означает, что пользователь видел элемент, но решил не покупать его, или пользователь даже не видел элемент (то есть не дал обратной связи).

Как правило, значение, выводимое из вашего алгоритма рекомендации, является не вероятностью покупки, а числовым значением, используемым для ранжирования этого элемента по сравнению со всеми другими потенциальными элементами. Таким образом, вы можете определить лучшие элементы X, чтобы рекомендовать их пользователю.

Вы можете использовать стандартную совместную фильтрацию по обсуждаемому типу данных, а также использовать методы факторизации.

...