У меня есть обучающий набор данных, содержащий 40000 строк, и я смог успешно сгенерировать randomForest
для своего набора данных.
Я пытаюсь теперь использовать его для прогнозирования на моем тестовом наборе.Мои обучающие и тестовые наборы данных представляют собой 2 разных фрейма данных, а имена столбцов между 2 фреймами данных не совпадают.Я получаю сообщение об ошибке, когда я запускаю свой прогноз.
library(randomForest)
set.seed(2018)
new_train_rf= randomForest(workdf.V1~.,data = new_train_df, mtry=6, ntree=25)
new_train_rf
summary(new_train_rf)
Прогнозы набора тестовых данных:
test_pred = predict(new_train_rf, newdata=new_test_df)
test_pred
summary(test_pred)
Ошибка в eval (predvars, data, env): объект 'Var57' не найден
Имена столбцов в тестовом фрейме данных:
testdf.Var218_UYBR, testdf2.Var6, testdf2.Var13, testdf2.Var21
Имена столбцов в фрейме данных обучения:
workdf.Var218_UYBR, tempdf2.Var6, tempdf2.Var13, tempdf2.Var21
Пожалуйста, помогите!Я новичок в R, и я пытался выяснить, почему мой прогноз не работает