Ну, вы в значительной степени ответили на свой вопрос. Но, что касается расширения, в последнем случае данные, помеченные как 0 или 1, в значительной степени зависят от типа используемого вами алгоритма, например, ID3, который использует значение режима для прогнозирования. аналогично C4.5 и C5 или CART имеют различные критерии, основанные на приросте информации, индекс Джинни и др. c и * c ....
В упрощенном виде, процесс обучения дерева решений и прогнозирования целевые характеристики экземпляров запросов следующие:
Представляет набор данных, содержащий несколько обучающих экземпляров, характеризующихся множеством описательных признаков и целевого объекта
Обучите модель дерева решений, непрерывно разделяя целевой объект по значениям описательных признаков, используя меру получения информации в процессе обучения
Увеличивайте дерево до тех пор, пока мы выполнить sh критерий остановки -> создать конечные узлы, которые представляют прогнозы, которые мы хотим сделать для новых экземпляров запроса
Показать экземпляры запроса в дереве и запустить по дереву, пока мы прибыть в конечные узлы
СДЕЛАНО - Поздравляем, вы нашли ответы на свои вопросы
вот ссылка, которую я предлагаю, которая объясняет дерево решений очень подробно с нуля. Дайте ему хорошее чтение -
https://www.python-course.eu/Decision_Trees.php