Как рассчитать критерии MSE в RandomForestRegression? - PullRequest
0 голосов
/ 30 мая 2019

Теперь я использую RandomForestRegressor из sklearn.ensemble для анализа набора данных, и я выбираю «mse» в качестве функции для измерения качества разделения.Но мне не совсем понятно, как рассчитывается mse.Может ли кто-нибудь объяснить мне это здесь (лучше с уравнениями) или дать мне некоторые ссылки на это?Заранее спасибо.

1 Ответ

1 голос
/ 30 мая 2019

Если я хочу кратко ответить на этот показатель, который является одним из методов функции стоимости, если вы считаете, что ваша модель следует зеленой линии на рисунке ниже, а эти синие точки - ваши данные MSE, как следует из названия, означает среднюю сумму квадрата. области всех точек данных относительно линии, которая в целом представляет ваши ошибки модели . img MSE можно рассчитать по:

img

Показывает насколько хорош или плох наш медель . меньше MSE, лучше модель!

Дополнительная информация:

Понимание метрик ошибок регрессии в Python

Введение в функции потерь

Обновление 30.05.2019: Чтобы проверить вещи, вы можете покопаться в документации, а иногда и в кодах, основываясь на ее документации .RandomForestRegressor , MSE - не что иное, как уменьшение дисперсии в качестве критерия выбора функции, даже если вы проверяете исходный код, он используется для измерения качества разделения . С другой стороны, если вы сомневаетесь относительно подхода MSE в .RandomForestRegressor, вы можете использовать его самостоятельно, настроив criterion следующим образом:

from sklearn.metrics import mean_squared_error
from sklearn.ensemble import RandomForestRegressor
#Feature Selection
criterion = mean_squared_error(y, predictions)
RandomForestRegressor( ...,criterion= criterion,...)

или используя numpy:

import numpy as np
criterion = np.mean((y_test - est.predict(X_test))**2)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...