Разделить данные в R, разделить на проценты - PullRequest
0 голосов
/ 17 марта 2019

У меня есть набор данных, соответствующий наборам данных разных типов.Тогда как можно рассчитать случай.

Данные должны быть разбиты на один случай: 1) Первый случай - 15% данных поезда и 5% теста

Какправильно написать?

1 Ответ

0 голосов
/ 17 марта 2019

Без createDataPartition простой способ будет следующим:

Предположим, вы хотите train_prop в качестве тренировочного набора и test_prop в качестве тестового набора из набора данных my_dataset. В идеале их сумма будет 1 или 1-val_prop, но здесь вы хотите 15% и 5% по некоторым причинам. Так что вам понадобится 0,15 и 0,05 соответственно.

indices <- sample(x = rep.int(x = c(0, 1, 2),
                  times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]
...