Я пытаюсь оценить дерево решений в R с помощью пакета 'rpart'.Единицей анализа являются отдельные лица, и двумя из соответствующих переменных являются род занятий (OCC = 1, если работает, и OCC = 0, если безработный) и расстояние до рабочего места (WORKD).WORKD имеет значения только для людей, которые работают (OCC = 1), и NA для людей, которые не работают (если OCC = 0, WORKD = NA).
Векторы этих переменных будут выглядетьчто-то вроде следующего:
OCC <- c (1,0,0,1,1,0,1) </p>
WORKD <- c (0,4, NA, NA, 1,5,2,4, NA, 0) </p>
Мой вопрос: есть ли у rpart возможность рассматривать переменную WORKD только в ветвях, для которых она уже разбита OCC = 1?
Мне бы не хотелосьввести WORKD = 0 для безработных, так как он всегда рассматривает WORKD как более актуальный, чем OCC.С другой стороны, только использование WORKD с этой заменой будет игнорировать наличие людей, работающих из своего дома (OCC = 1, WORKD = 0).