Я пытаюсь решить упражнения ISLR. Во время одного упражнения в случайном лесу, когда я пытаюсь предсказать значения на основе набора данных тренировки. Я получаю больше значений прогноза, чем предоставленных новых данных.
- Всего строк в наборе данных = 506
- Строк, используемых в обучающем наборе = 300
- Строк, используемых в тестеset = 206
Я использую функцию predict()
для получения прогнозов для нового набора данных.
train = sample(1:nrow(Boston),300)
rf.p = randomForest(medv~., data= Boston, subset= train, mtry = dim(Boston)[2]-1)
pred.p = predict(rf.p, newdata = Boston[-train,])
Я ожидал, что длина pred.p
будет равна 206 как длина Boston[-train,]
, но я получаю pred.p
как вектор длины 503.