R: как использовать опцию subset в rpart? - PullRequest
0 голосов
/ 04 мая 2020

Из документации help(rpart) есть опция subset, которая является «необязательным выражением, говорящим, что в подгонке должен использоваться только поднабор строк данных».

Как именно я go об использовании этой опции?

library(rpart)
fit <- rpart(Kyphosis ~ Age + Number + Start,
             data = kyphosis,
             subset = sample(1:nrow(kyphosis), 20))

В приведенном выше коде я случайно выбрал 20 индексов строк из данных kyphosis. Это правильное использование?

1 Ответ

0 голосов
/ 04 мая 2020

Да, это нормально. С помощью subset вы также можете:

  • Явно выбирать строки из ваших data.frame: subset=1:21
  • Выбирать строки на основе значения (значений) переменных: subset=(Age<50)
...