Дерево использует нисходящий, жадный подход, но для дерева регрессии у меня следующий вопрос:
Предположим, что существует 20 точек данных, 10 из которых короче 5 футов, а 10 из них имеют рост не менее 6 футов.
Тогда, если мы разделяем по высоте (в футах), не имеет значения, если мы выберем любое значение X, которое находится между 5 футами и 6 футами, верно? Поскольку это собирается разделить данные на две группы: каждая, содержащая 10.
В этом случае как дерево выбирает значение X для высоты? Просто случайное значение между 5 и 6? Или есть конструктивный способ выбрать значение X? Любая ссылка или помощь будут оценены. Спасибо