Случайный лесной прогноз - PullRequest
0 голосов
/ 06 декабря 2018

У меня есть обучающий набор данных, содержащий 40000 строк, и я смог успешно сгенерировать randomForest для своего набора данных.

Я пытаюсь теперь использовать его для прогнозирования на моем тестовом наборе.Мои обучающие и тестовые наборы данных представляют собой 2 разных фрейма данных, а имена столбцов между 2 фреймами данных не совпадают.Я получаю сообщение об ошибке, когда я запускаю свой прогноз.

library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)

Прогнозы набора тестовых данных:

test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)

Ошибка в eval (predvars, data, env): объект 'Var57' не найден

Имена столбцов в тестовом фрейме данных:

testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21

Имена столбцов в фрейме данных обучения:

workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21

Пожалуйста, помогите!Я новичок в R, и я пытался выяснить, почему мой прогноз не работает

1 Ответ

0 голосов
/ 10 декабря 2018

Мои данные испытаний и тренировок были разделены на 2 разных фрейма данных.Я смог успешно выполнить свои прогнозы после того, как переименовал столбцы в моем df (тест и тренировка), чтобы они соответствовали.

...