Из документации help(rpart)
есть опция subset
, которая является «необязательным выражением, говорящим, что в подгонке должен использоваться только поднабор строк данных».
Как именно я go об использовании этой опции?
library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
data = kyphosis,
subset = sample(1:nrow(kyphosis), 20))
В приведенном выше коде я случайно выбрал 20 индексов строк из данных kyphosis
. Это правильное использование?