Разделение категориальных атрибутов для дерева классификации и регрессии (CART) - PullRequest
0 голосов
/ 08 февраля 2019

Я знаю, что мы можем несколько раз разделить числовые атрибуты на разных уровнях для дерева классификации и регрессии (CART), которое является двоичным деревом.Как насчет категориальных атрибутов?Можем ли мы разделить несколько раз или только один раз?если нет, то в чем причина?

Ответы [ 2 ]

0 голосов
/ 02 июня 2019

Если категориальные предикторы имеют более 2 категорий;Вы можете разделить его снова, как в случае числовой переменной.

Например;

Если одним из предикторов является «Семейное положение» с 3 категориями : «Женат», «Не женат» и «Разведен».

Вы можете иметь одно двоичное разбиениекак 'Неженатый' против 'Других' , где последняя группа состоит из наблюдений обеих групп 'Женат' и 'Разведен'.

Далее, если требуется на каком-то этапе, вы можетеразбить группу «Другое» на две категории «Женат» и «В разводе» .

На основе некоторого правила разделения вы можете распространить эту идею и на более чем 3 категории.

0 голосов
/ 09 февраля 2019

Двоичные деревья являются двоичными.

Если вы выполняете многоходовое разделение, оно больше не является двоичным, и поиск оптимального разделения становится более дорогим, чем вы хотели бы, в то время как общие возможности не меняютсяпо сравнению с использованием нескольких уровней.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...