Я не понимаю, почему мы используем функцию set.seed в данных тестирования / обучения. Я понимаю, что случайным образом генерируется запоминающаяся последовательность для воспроизведения, но мы не полагаемся на нее в самом коде после того, как мы установили функцию. Вот пример кода:
data(mtcars)
## 75% of the sample size
smp_size <- floor(0.75 * nrow(mtcars))
## set the seed to make your partition reproducible
set.seed(123)
train_ind <- sample(seq_len(nrow(mtcars)), size = smp_size)
train <- mtcars[train_ind, ]
test <- mtcars[-train_ind, ]