Как разделить данные на набор поездов (и набор тестов) каждую строчку в R? - PullRequest
0 голосов
/ 07 мая 2020

У меня проблема с классификацией, когда у меня есть огромный НАБОР ДАННЫХ, содержащий 308 500 данных. Я хочу разделить эти данные на набор поездов и набор тестов, чтобы создать модель.

Но я хочу, чтобы данные поезда брали, например, выборку для DATASET каждые ряды, например, каждые 1.000 rows, поэтому я знаю, что набор поездов будет построен из строк из всех DATASET. Есть ли способ сделать это?

Например, мне нужно что-то вроде этого:

train = DATASET[take sample every 1000 rows]

1 Ответ

0 голосов
/ 07 мая 2020

Вы можете использовать seq для создания индексов строк для подмножества.

train_inds <- seq(1, nrow(DATASET), 1000)
train <- DATASET[train_inds, ]
test <- DATASET[-train_inds, ]
...