У меня есть класс c Набор данных для взрослых из репозитория машинного обучения http://mlr.cs.umass.edu/ml/datasets/Adult, и я пытаюсь построить дерево решений для прогнозирования дохода. Я хочу сделать дерево решений, основанное только на четырех переменных: рабочий класс, возраст, образование и пол. Кажется, что rpart не считает переменную «рабочий класс», потому что, когда я запускаю приведенный ниже код с или без переменной рабочего класса в формуле, я получаю одно и то же дерево решений в конце. Я что-то здесь скучаю?
Заранее спасибо.
То же дерево решений с рабочим классом и без него.
data1=read.csv("C:\\Users\\Nikos\\Desktop\\adult.csv")
adult.model <- rpart(income ~ workclass + age + education.num + sex , data = data1)
rpart.plot(adult.model)```