Размеры поезда и тестового набора равны нулю в R - PullRequest
0 голосов
/ 14 февраля 2019

Я создал поезд и тестовый набор, используя свою самодельную функцию:

splitter <- function(dataset, number1, number2 = 0.7){
  trn_index <- createDataPartition(y = dataset[,number1],
                                   p = number2, list = FALSE)
  trn_set = dataset[trn_index,]
  tst_set = dataset[-trn_index,]
  data <- list(trn_set = as.list(trn_set), 
               tst_set = as.list(tst_set))
}

general_splits <- splitter(general, 2, 0.6)

table(general_splits$trn_set$Attrition)

Цель состояла в том, чтобы создать функцию, которая делит набор данных на поезд и тестовый набор на основе трех переменных: набор данныхстолбец для разделения на (число 1) и доля строк в наборе поезд / тест (число 2).Это возвращает это как объект списка.Я хочу разделить общий набор данных.

Когда я пытаюсь проверить, сработало ли это, я вижу отличные результаты:

> table(general_splits$trn_set$Attrition)
   No    Yes 
   2185  419

> table(general_splits$tst_set$Attrition)
   No    Yes 
   1456  278 

Однако, когда я хочу проверить размеры наборовв моем вложенном фрейме данных результат такой:

> dim(general_splits$trn_set)
NULL

Что мне здесь не хватает?Набор данных содержит около 3500+ строк и 21 переменную, и это видно из таблиц.

...