Я много читал и пробовал, но все еще застрял с решением моей проблемы (хотя я думаю, что это должно быть относительно не сложно, и что-то обязательно будет реализовано раньше).
В принципе, я хочуреализовать систему рекомендаций и не может найти подходящую библиотеку (в основном, язык lib не имеет значения, но предпочтительнее Python или Java) или алгоритм.
Прежде всего, структураdata:
У меня есть три файла: users.csv, items.csv и взаимодействия.csv
У пользователей есть функции: City, Country, Gender, Birthdate
(и в основном это те функции, которые я хочу использовать длярассчитать сходство между пользователями)
Предметы - это в основном разные спортивные события и имеют следующую структуру: SportName, Location, StartTime, League
(и в основном это те функции, которые я хочу использовать для вычисления сходства между предметами)
Взаимодействияв основном история посещаемых пользователем событий со структурой: UserId, ItemId, TimeWhenTicketWasBought
.
Первая проблема заключается в том, что в моем наборе данных нет оценок, и большинству алгоритмов требуется эта функция.
По сути, мне нужны персональные рекомендации для пользователей на основе ихистория посещаемости.(например, если пользователь в основном посещает футбольные матчи определенной лиги, было бы разумно рекомендовать другие игры той же лиги или, возможно, другие игры в том же месте).
При этом для пользователей с холодным стартомЯ хочу рекомендовать элементы схожих пользователей к текущему.
Другая проблема заключается в том, что этот домен довольно динамичный, новые события создаются каждый день, а старые события уже исчезли и должны быть исключены из рекомендаций.
Звучит как обычная проблема, но я до сих пор не могу найти пример кода, обширное написание или библиотеку.Просто обзоры.
К этому времени я проверял в основном библиотеки Python (TensorRec, LightFM, Surprise), но не могу понять, как достичь своих целей.
Потрясающеподход был бы решением с использованием Deep Learning (LSTMs и Recurrent Neural Networks), но все же я не могу найти хорошее руководство с чего начать.
Любая помощь, любые ссылки на библиотеки или учебные пособия или примеры кодаили исследования приветствуются.Заранее спасибо.