Путаница в принятии классификатора дерева решений - PullRequest
0 голосов
/ 05 июня 2018

Я хочу предсказать, будут ли студенты играть в крикет или нет {Target Variable}.Предположим, у меня есть 3 столбца: пол, класс, возраст. Как мы видим, у меня есть 2 категориальных атрибута и один непрерывный атрибут.Принимая решение о корневом узле, я знаю, что оба категориальных атрибута можно традиционно сравнивать с использованием критерия Джини.Как я должен разделить непрерывный атрибут и какой критерий я должен принять во внимание, чтобы его считали конкурентом за то, что он является корневым узлом против 2 категориальных?

Ответы [ 2 ]

0 голосов
/ 05 июня 2018

Вы можете разделить непрерывные переменные по интервалам.Предположим, у вас есть непрерывные переменные от 1 до 10, вы можете разделить их как 1 до 5 в одной категории и от 6 до 10 в другой категории.

0 голосов
/ 05 июня 2018

Это действительно зависит от того, какую модель (алгоритм) вы используете для разделения.Тем не менее, в общем случае F-тест - это то, что обычно используется при расщеплении непрерывных переменных.Попробуйте взглянуть на то, что SAS использует для их реализации: SAS - критерии разделения .Кроме того, вот довольно хорошее объяснение деревьев решений: Дерево решений.Здесь начинается .

...