Ошибка в `[[<-. Data.frame` (` * tmp * `, i, value = integer (0)): в замене 0 строк, в данных 207 - PullRequest
0 голосов
/ 27 ноября 2018

Абсолютно новичок с R здесь, и я знаю, что эта ошибка уже была устранена, но доступные ответы не решают мою проблему.

Я пытаюсь применить наивный байесовский классификатор к тестовому набору данных, но с меньшим количествомпеременные (столбцы), чем обучающий набор данных, используемый для создания классификатора.Другими словами, я создал классификатор для прогнозирования принадлежности клиентов к определенным сегментам на основе определенных переменных (8 независимых переменных), и он отлично работал на наборе тестовых данных (идентичных обучающим данным с точки зрения переменных), но теперь я хочупроверить, как будет работать модель, если у меня есть данные, которые не включают в себя все переменные из данных обучения (например, если у меня есть только демография клиентов). Поэтому я выбрал определенные переменные (столбцы) из данных тестакак это:

data.test2 <- data.test[,c(1,2,5,6,8)] 

данные теста как таковые включают в себя только пять независимых переменных из исходных 8 в обучающем наборе 8. Я также вынул переменную ответа (столбец 9)

ОднакоЯ получаю эту ошибку:

Ошибка в `[[<-. Data.frame` (` * tmp * `, i, value = integer (0)): <br>замена содержит 0 строк, данные имеют 207

Я убедился, что имена переменных точно такие же, как в обучающих данных. Насколько я понимаю из пакета, это должноне проблема:

"Новые данные: кадр данных с новыми предикторами (возможно, с меньшим количеством столбцов, чем обучающих данных).Обратите внимание, что имена столбцов новых данных сопоставляются с именами обучающих данных. "

Есть идеи? Спасибо!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...