Общий процесс состоит в том, чтобы сканировать возможные значения разделения для любого заданного предиктора, измерять качество каждого разделения и выбирать лучшее.В целях эффективности сканирование может не пробовать каждое возможное разделение, а вместо этого пробовать каждый процентиль или какой-либо другой сокращенный набор вариантов.Качество любого разделения можно измерить любым количеством способов, таких как получение информации, дублирование и т. Д.
Если вы говорите конкретно об алгоритме CART, первоначально описанном Брейманом, Фридманом, Стоун Олшен, то проверьте ихкнига "Деревья классификации и регрессии" (1984).