Я создал поезд и тестовый набор, используя свою самодельную функцию:
splitter <- function(dataset, number1, number2 = 0.7){
trn_index <- createDataPartition(y = dataset[,number1],
p = number2, list = FALSE)
trn_set = dataset[trn_index,]
tst_set = dataset[-trn_index,]
data <- list(trn_set = as.list(trn_set),
tst_set = as.list(tst_set))
}
general_splits <- splitter(general, 2, 0.6)
table(general_splits$trn_set$Attrition)
Цель состояла в том, чтобы создать функцию, которая делит набор данных на поезд и тестовый набор на основе трех переменных: набор данныхстолбец для разделения на (число 1) и доля строк в наборе поезд / тест (число 2).Это возвращает это как объект списка.Я хочу разделить общий набор данных.
Когда я пытаюсь проверить, сработало ли это, я вижу отличные результаты:
> table(general_splits$trn_set$Attrition)
No Yes
2185 419
> table(general_splits$tst_set$Attrition)
No Yes
1456 278
Однако, когда я хочу проверить размеры наборовв моем вложенном фрейме данных результат такой:
> dim(general_splits$trn_set)
NULL
Что мне здесь не хватает?Набор данных содержит около 3500+ строк и 21 переменную, и это видно из таблиц.