Я пытаюсь использовать функцию прогнозирования, но на выходе нет ожидаемого количества испытаний. Я предполагаю, что что-то не так с моим data.frame после прочтения других ошибок, но не могу понять это.
Я пытался убедиться, что мои новые данные имеют то же имя переменной, что и моя модель, но это не исправит это. Разные строки - это различное количество найденных решений, например, я обучаю более 50 различных наборов информации и тестирую более 39950 наборов.
И в train_data, и в test_data есть 10 столбцов, которые представляют собой выборки, которые будут включены в каждый расчет. Модель правильно находит их и называет их test_data1, test_data2 и т. Д.
Я уверен, что кое-что мне не хватает, но я не могу понять это.
trainingSampleSize <- k
sample_sample[[k-1]] <- sample(1:ncol(pre$train_data), k, replace = FALSE)
train_data <- pre$train_data[,sample_sample[[k-1]]]
test_data <- pre$test_data[,sample_sample[[k-1]]]
data_lm <- data.frame(train_data, pre$train_targets)
cvFitList[[(k-1)]] <- lm(pre$train_targets ~ train_data, data_lm)
prediction[[k-1]] <- predict(cvFitList[[(k-1)]], data.frame(train_data=test_data))
Моя цель - получить прогноз для каждого набора test_data, 39950 - результат прогнозирования.
Я получил предупреждение:
В 'newdata' было 39950 строк, а в найденных переменных - 50 строк
и прогноз [[k-1]] имеет только 50 строк