Question

Я рассчитываю оценить производительность теста случайного лесного регрессора в Python и, в дополнение к выполнению перекрестной проверки на обучающем множестве, мне интересно, уместно ли проводить какой-либо анализ корреляции между предсказанным Y результаты теста и фактические результаты теста Y?

Мое, возможно, слишком упрощенное представление о том, что значительная корреляция между ними будет указывать на то, что предсказанные Y совпадают с фактическими тестовыми Y, и, как таковые, предсказания хороши ...

Любые альтернативные предложения приветствуются. Спасибо.

Vage Egiazarian · Answer 1 · 28 августа 2018

Вы можете выполнить корреляционный анализ, если это необходимо, но если корреляция велика, это не всегда так, что ваша модель хороша. Вы также должны взглянуть на вариант. Также зависит от того, какую задачу вы решаете (классификация, сегментация, регрессия и т. Д.), Вы можете использовать метрики, чтобы определить, насколько хорошо вы прогнозируете. Вы можете найти различные метрики здесь http://scikit -learn.org / stable / modules / model_evaluation.html .

Оценить производительность произвольного леса с помощью R-Squared

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Оценить производительность произвольного леса с помощью R-Squared

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы