Нахождение лучшего регрессионного дерева - PullRequest
0 голосов
/ 04 сентября 2018

Дерево использует нисходящий, жадный подход, но для дерева регрессии у меня следующий вопрос:

Предположим, что существует 20 точек данных, 10 из которых короче 5 футов, а 10 из них имеют рост не менее 6 футов.

Тогда, если мы разделяем по высоте (в футах), не имеет значения, если мы выберем любое значение X, которое находится между 5 футами и 6 футами, верно? Поскольку это собирается разделить данные на две группы: каждая, содержащая 10.

В этом случае как дерево выбирает значение X для высоты? Просто случайное значение между 5 и 6? Или есть конструктивный способ выбрать значение X? Любая ссылка или помощь будут оценены. Спасибо

...