Как использовать совместную фильтрацию для прогнозирования пользователей по их поведению? - PullRequest
1 голос
/ 05 февраля 2020

Это кажется очень странным, но как предсказать определенного пользователя по его / ее рекомендациям?

ПРИМЕР:

Возможно, мы были проводя эксперимент о том, как пользователи перемещают оценки ie во времени.

И мы провели опрос в первый год (2019) и во второй (2020) с теми же пользователями и фильмами.

Но наша база данных потерпела крах , поэтому у нас есть только рекомендации пользователей на второй год, но мы не знаем, чьи рекомендации даны.

У нас есть: матрица пользователей-рекомендаций в первый год, как этот:

Users-Reccomendation matrix 1

И матрица пользователей-рекомендаций во втором году, но без столбца «target»:

enter image description here


Итак, по данным первого года , мы хотим восстановить / прогнозировать столбец «target» .

Обычно для прогнозирования рейтингов mov ie используется совместная фильтрация, но все наоборот blem.

Можно ли использовать совместную фильтрацию?

Если да, какие взаимодействия необходимо выполнить с алгоритмом для решения проблемы?

Или есть другой подход или ML-алгоритм для этого?

Спасибо!

PS: если вы приложите пример Python к аналогичной задаче, это было бы здорово!

И извините за то, что вы не прикрепили реальные данные и задачу к этому посту, я буквально не может сделать это по многим причинам:)

1 Ответ

1 голос
/ 05 февраля 2020

Возможно, есть несколько способов решения этой проблемы, но я бы отнесся к этому как к задаче присваивания . В основном вы хотите присвоить пользователям 2020 mov ie оценок. Для этого вам необходимо:

  1. Определить стоимость присвоения рейтингов mov ie пользователю. Это можно сделать путем определения функции расстояния между значениями 2020 ie и 2019 ie. Примером может служить L2-норма (евклидово расстояние). Поэтому назначение 2020 mov ie оценок 0 ([1, 2, 4, 4, 6]) пользователю id_0 (2019 оценок = [1, 1, 3, 5, 6]) обойдется в sqrt (3)

  2. Построение матрицы с использованием заданного расстояния функция, отражающая расстояние (стоимость назначения) между каждым пользователем и каждой строкой 2020 mov ie рейтинги

  3. Найти лучшее назначение (с наименьшей стоимостью) из 2020 mov ie рейтинги для пользователи, используя венгерский алгоритм

...