Когда использовать случайный лес - PullRequest
0 голосов
/ 03 июля 2019

Я понимаю, что модели случайного леса могут использоваться как для классификации, так и для регрессионных ситуаций. Существуют ли более конкретные критерии для определения того, где модель случайного леса будет работать лучше, чем обычные регрессии (линейные, лассо и т. Д.) Для оценки значений или логистической регрессии для классификации?

1 Ответ

1 голос
/ 03 июля 2019

Идея модели случайного леса строится из множества деревьев решений, и это контролируемый алгоритм обучения ансамбля, позволяющий уменьшить переобученность в отдельных деревьях решений.

Теория машинного обученияв том, что нет единой модели, которая превосходит все другие модели, и, следовательно, всегда рекомендуется опробовать разные модели, прежде чем получить оптимальную модель.с данными разной природы.Каждая модель делает внутренние предположения о данных, а модель с предположениями, которые наиболее соответствуют данным, как правило, лучше работает для данных.Например, логистическая модель подходит для категориальных данных с гладкой линейной границей решения, и если данные имеют эту особенность, тогда как случайный лес не принимает гладкую линейную границу решения.Следовательно, характер ваших данных влияет на выбор моделей, и всегда полезно попробовать их все, прежде чем прийти к выводу.

...