Оценить производительность произвольного леса с помощью R-Squared - PullRequest
0 голосов
/ 28 августа 2018

Я рассчитываю оценить производительность теста случайного лесного регрессора в Python и, в дополнение к выполнению перекрестной проверки на обучающем множестве, мне интересно, уместно ли проводить какой-либо анализ корреляции между предсказанным Y результаты теста и фактические результаты теста Y?

Мое, возможно, слишком упрощенное представление о том, что значительная корреляция между ними будет указывать на то, что предсказанные Y совпадают с фактическими тестовыми Y, и, как таковые, предсказания хороши ...

Любые альтернативные предложения приветствуются. Спасибо.

1 Ответ

0 голосов
/ 28 августа 2018

Вы можете выполнить корреляционный анализ, если это необходимо, но если корреляция велика, это не всегда так, что ваша модель хороша. Вы также должны взглянуть на вариант. Также зависит от того, какую задачу вы решаете (классификация, сегментация, регрессия и т. Д.), Вы можете использовать метрики, чтобы определить, насколько хорошо вы прогнозируете. Вы можете найти различные метрики здесь http://scikit -learn.org / stable / modules / model_evaluation.html .

...