RandomForestRegressor для задач классификации - PullRequest
0 голосов
/ 06 января 2020

Я проходил курс прикладного машинного обучения на курсе Python на Coursera и в назначении недели 4, я нашел кое-что интересное. Во время моей первой попытки выполнить задание я пытался использовать RandomForestClassifier из sklearn для прогнозирования меток, но модель была перегружена и показала плохие результаты теста. В качестве эксперимента я переключился на RandomForestRegressor и, угадайте, что он не только не подошел, но и точность теста была намного выше. Итак, почему RandomForestRegressor намного лучше справляется с проблемой двоичной классификации?

1 Ответ

2 голосов
/ 06 января 2020

Регрессор Случайного леса действительно несколько отличается от классификатора Случайного леса, когда дело доходит до объединения деревьев решений:

  • Классификатор использует режим предсказанных классов деревьев решений
  • Регрессор использует среднее значение прогнозируемых значений деревьев решений

Из-за этой разницы модели могут иметь разные результаты. И в некоторых случаях это может привести к тому, что регрессор будет работать лучше, чем классификатор.

В дополнение к этому, я бы сказал, что если вы правильно настроите свои гиперпараметры, классификатор должен работать лучше по проблеме классификации, чем регрессор.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...