R модель рассматривает поле индекса как обязательный фактор - PullRequest
0 голосов
/ 25 апреля 2019

У меня есть обученная модель в R (метод xgbtree, каретка), изученная на наборе данных, таком как ниже.

filenumber, premium, ID1, ID2, ID3, ID4, ID5.

где filenumber - это просто индексный ключ для каждой строки, и он пропущен в обучающем упражнении, а модель тренируется для «Premium ~.-filenumber»

Поля ID - это переменные, каждое из которых содержит 1-10 уровней, которыеЯ думаю, что он не должен иметь отношения к конкретному вопросу, приведенному ниже.

Получение прогнозов прекрасно работает при разделении тестовых данных.Теперь, когда я пытаюсь делать прогнозы для всего нового набора данных, который использует тот же точный формат, он жалуется на то, что поле filenumber имеет новый уровень.Не следует даже пытаться использовать номер файла для получения прогноза .. help?

Ошибка: Ошибка в model.frame.default (Условия, новые данные, na.action = na.action, xlev = object $ xlevels): номер факторного файла имеет новый уровень CE19CGL235320IC

...