createDataPartition не разделяет данные - PullRequest
0 голосов
/ 18 октября 2019

Я пытаюсь разбить фрейм данных на обучающие и тестовые наборы, используя createDataPartition в R, причем обучающий набор содержит 60% данных. Когда я запустил этот код и посмотрел на получившиеся объекты, у SF.training_2 были все наблюдения, а у SF_test.2 - нет. Помогите? Я также получал сообщение об ошибке, что итоговая команда не была распознана, даже если я успешно выполнил ее в другом месте моего кода, что я нашел путаницей / относительно.

inTrain <- createDataPartition(
  y = paste(data_train_test$Rooms, 
            data_train_test$crime_nn5, 
            data_train_test$nhood, 
            data_train_test$BLDGSQFT, 
            data_train_test$estimate),
  p = .60, 
  list = FALSE)

SF.training_2 <- data_train_test[inTrain,]

summmary(SF.training_2)

SF.test_2 <- data_train_test[-inTrain,]

1 Ответ

0 голосов
/ 20 октября 2019

Похоже, вы используете каретку и библиотеку Tidyverse. Чтобы помочь вам, нам нужен пример данных. Давайте создадим фиктивный набор данных:

library(caret)
library(tidyverse)
data_train_test <- data.frame(Rooms c("a","b","c","a","b","c","a","b","c","a"),
                          crime_nn5 = c(2,3,4,2,3,2,3,2,3,4), nhood = c("Alvem","Rhye","Huttons","Rhye","Olan","Alvem","Olan","Huttons","Alvem","Rhye"),
                          BLDGSQFT = c(400,600,660,480,590,480,510,500,700,570),
                          estimate = c(34000, 55000, 60000, 37000, 50000, 45000, 48000, 51000, 80000, 52000))

Теперь вы хотите создать раздел данных. Как вы можете прочитать в документации (https://cran.r -project.org / web / packages / caret / caret.pdf ), «y» должен быть вектором результатов, но в вашем коде это не так. ,Кстати, если сказать, что функция сводки дает вам сообщение об ошибке, содержит опечатку, написанную «summmary».

inTrain <- createDataPartition(data_train_test$Rooms, times = 1, p = 0.6, list = FALSE)

SF.training_2 <- data_train_test[inTrain,]

summary(SF.training_2)

SF.test_2 <- data_train_test[-inTrain,]

Этот код должен работать для вас. Пожалуйста, не забудьте привести минимальный пример воспроизводимых данных, чтобы мы могли помочь вам лучше.

С уважением,

Alexis

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...