Есть ли способ рассмотреть переменную только в определенных ветках в rpart? - PullRequest
1 голос
/ 28 апреля 2019

Я пытаюсь оценить дерево решений в R с помощью пакета 'rpart'.Единицей анализа являются отдельные лица, и двумя из соответствующих переменных являются род занятий (OCC = 1, если работает, и OCC = 0, если безработный) и расстояние до рабочего места (WORKD).WORKD имеет значения только для людей, которые работают (OCC = 1), и NA для людей, которые не работают (если OCC = 0, WORKD = NA).

Векторы этих переменных будут выглядетьчто-то вроде следующего:

OCC <- c (1,0,0,1,1,0,1) </p>

WORKD <- c (0,4, NA, NA, 1,5,2,4, NA, 0) </p>

Мой вопрос: есть ли у rpart возможность рассматривать переменную WORKD только в ветвях, для которых она уже разбита OCC = 1?

Мне бы не хотелосьввести WORKD = 0 для безработных, так как он всегда рассматривает WORKD как более актуальный, чем OCC.С другой стороны, только использование WORKD с этой заменой будет игнорировать наличие людей, работающих из своего дома (OCC = 1, WORKD = 0).

...