Без createDataPartition простой способ будет следующим:
Предположим, вы хотите train_prop
в качестве тренировочного набора и test_prop
в качестве тестового набора из набора данных my_dataset
. В идеале их сумма будет 1
или 1-val_prop
, но здесь вы хотите 15% и 5% по некоторым причинам. Так что вам понадобится 0,15 и 0,05 соответственно.
indices <- sample(x = rep.int(x = c(0, 1, 2),
times = round(nrow(my_dataset) * c(1 - train_prop - test_prop, train_prop, test_prop))))
train_set <- my_dataset[indices == 1,]
test_set <- my_dataset[indices == 2,]