LightFM: разработка функций пользователя / элемента для совместной фильтрации (неполные функции / несколько записей) - PullRequest
0 голосов
/ 06 февраля 2019

Я пытаюсь построить базовые базовые показатели BPR и WARP для модели неявной обратной связи, и в настоящее время я немного застрял в проектировании функций и у меня возникло несколько вопросов о том, как LightFM обрабатывает матрицу объектов.

Скажем, я хочу построить матрицу пользовательских функций, и мои поля выглядят так:

{
    "id": "818499",
    "username": "nvok",
    "name": "nvok",
    "join_date": "2016-08-12",
    "followers": "696",
    "following": "65",
    "ideas": "1863",
    "like_count": "23",
    "subscribers_count": "132",
    "subscribed_to_count": "1",
    "location": "United States",
    "trading_strategy": "{'assets_frequently_traded': [], 'approach': 'Growth', 'holding_period': 'Position Trader', 'experience': None}"
}

Если я собираюсь создать матрицу пользовательских функций, а профиль пользователя был немного неполным;например, если поле location оставлено пустым, LightFM пропустит эту функцию для этого конкретного пользователя или мне придется опустить эту конкретную функцию?Все поля должны быть заполнены?Местоположение кажется полезной функцией для обучения.

Функции моего предмета представлены в виде твитов и различной информации об этом твите;отметка времени, лайки и т. д. В случае использования хэштегов существует поле «символы», которое выглядит следующим образом:

"symbols": "[{
    'id': 11571, 
    'symbol': 'FEYE', 
    'title': 'FireEye Inc', 
    'is_following': False, 
    'exchange': 'NASDAQ', 
    'sector': None, 
    'industry': None, 
    'trending': False, 
    'trending_score': -1.40734, 
    'watchlist_count': 13750
}]"

Эффективно ли LightFM использует информацию, содержащуюся в списках, или мне придется разделить ее наотдельные функции, может быть, сам хэштег является ключом, а значение равно 1 для настоящего времени?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...