Обработка NaN и пропущенных значений при создании файла libffm.txt в качестве входных данных для машины факторизации поля (xLearn) - PullRequest
0 голосов
/ 07 ноября 2019

Я настраиваю машину факторизации поля (xLearn), и входные данные являются категориальной переменной, которая имеет NaN. У меня такой вопрос: как должны быть определены отсутствующие значения, когда они вводятся в ffm? Независимо от того, какие значения я установил (например, NaN или ''), я получаю нижеприведенный файл .txt. Является ли этот файл правильным в качестве ввода для FFM?

2 0:0:0.09772819999999999 1:2:1
4 0:0:0.26065900000000003 1:2:1
2 0:0:0.11356600000000001 1:3:1
1 0:0:0.062336199999999994 1:2:1
3 0:0:0.0 1:4:1

Значение «2» является NaN / отсутствующим значением в кадре данных. Это код, который я использую для создания набора данных .txt (из фрейма данных), и затем я вводю его в ffm: https://www.analyticsvidhya.com/blog/2018/01/factorization-machines/

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...