Как выбрать разделенные переменные для непрерывных объектов для дерева решений - PullRequest
0 голосов
/ 01 июня 2019

В настоящее время я реализую алгоритм дерева решений. Если у меня есть непрерывные избранные данные, как я могу решить точку разделения. Я наткнулся на несколько ресурсов, которые говорят, что нужно выбирать средние точки между каждыми двумя точками, но, учитывая, что у меня есть 8000 строк данных, это будет очень много времени. У метки выхода / объекта есть данные категории. Есть ли подход, где я могу выполнить эту операцию быстрее

1 Ответ

0 голосов
/ 02 июня 2019

Дерево решений работает для расчета энтропии и получения информации для определения наиболее важной функции.Действительно, 8000 строк не слишком много для дерева решений.Но, как правило, Случайный лес похож на дерево решений.Работает как ансамбль.Вы можете просмотреть и попробовать. Более того, возможно, медлительность связана с другой вещью.

...