Ошибка логистической регрессии: новые уровни в категориальном столбце в тестовых данных - PullRequest
0 голосов
/ 09 июня 2018

Поскольку я пытался предсказать, используя модель логистической регрессии в R, у меня появляется следующая ошибка:

Ошибка:

пред <- предикат(model, newdata = test) <br>Ошибка в model.frame.default (Условия, newdata, na.action = na.action, xlev = object $ xlevels): фактор admission_type_id имеет новые уровни 8

Насколько я понимаю, данные тестирования столбца "admission_type_id" имеют новые уровни по сравнению с данными обучения.Я попытался посмотреть на уникальные значения, и я вижу, что данные Train имеют все значения тестовых данных.

unique (train $ admission_type_id)
1 1 3 2 65 8 4
Уровни: 1 2 3 4 5 6 7 8

уникальный (тест $ admission_type_id)
1 6 1 2 3 5 8
Уровни: 12 3 4 5 6 7 8

Было бы очень полезно, если бы кто-нибудь мог помочь мне понять проблему.Спасибо.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...