Оценка основанной на контенте системы рекомендаций (где нет «пользователей») - PullRequest
2 голосов
/ 11 января 2020

Я создаю основанный на контенте RecSys для футболистов, используя набор данных FIFA 2020. В этом случае игроки являются «предметами», а их очки (способность к наведению, навыки дриблинга, позиционные очки и т. Д. c) - это «оценки». Я уже создал матрицу сходства по косинусу, чтобы ранжировать оценки сходства каждого игрока. Моя модель просто стремится сделать это: для любого данного игрока моя модель будет отображать 5 самых похожих других игроков.

Сейчас я нахожусь на стадии оценки своей модели и сталкиваюсь с некоторыми проблемами. Проведя некоторые чтения в Интернете, я понял, что, вероятно, НЕ МОГУ использовать статистические показатели, такие как RMSE или MAE. Более подходящим будет Precision and Recall (или, точнее, Mean Average Precision MAP).

Дело в том, что все эти метрики оценки требуют, чтобы действительный пользователь подтвердил их (например, чтобы фактически ВЫБРАТЬ Криштиану Роналду как "правильный" игрок, похожий на Лионеля Месси). Возвращаясь к исходному набору данных, это не похоже на случай с MOV ie рейтингами / элементами Amazon, где на самом деле этот элемент оценивался разными пользователями - FIFA 2020 - это просто набор баллов и атрибутов каждого игрока. Следовательно, я не могу «предсказать» рейтинг другого пользователя для другого игрока и дать рекомендации, основанные на этом.

Поэтому я хотел бы спросить, есть ли другие предложения по оценке моей модели, с точки зрения «правильности» «Рекомендуются похожие игроки? Еще раз, моя модель просто стремится отображать 5 самых похожих игроков для любого данного игрока.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...