Метрики сходства для основанной на контенте системы рекомендаций - PullRequest
0 голосов
/ 15 января 2020

Я уже создал основанный на контенте RecSys, использующий косинусное преобразование подобия ... и он работает довольно хорошо. Мой проект о том, чтобы рекомендовать подобных футболистов для любого конкретного игрока.

Однако, как я думаю, косинусное сходство игнорирует величину векторов, но для моего случая, где рейтинг каждого игрока / атрибуты рейтинга важно, что косинусное сходство может игнорировать этот аспект (у игрока с уровнями умения (80, 90, 70) будет тот же кос-сим, что и у другого с (40, 45, 35)).

Если величина имеет значение Мне было интересно, какое сходство metri c следует использовать вместо этого для преобразования данных? Еще одна вещь, если это имеет значение, мой набор данных является многомерным, с почти 100 функциями.

Спасибо!

...