Если я хочу кратко ответить на этот показатель, который является одним из методов функции стоимости, если вы считаете, что ваша модель следует зеленой линии на рисунке ниже, а эти синие точки - ваши данные MSE, как следует из названия, означает среднюю сумму квадрата. области всех точек данных относительно линии, которая в целом представляет ваши ошибки модели .
MSE можно рассчитать по:
Показывает насколько хорош или плох наш медель . меньше MSE, лучше модель!
Дополнительная информация:
Понимание метрик ошибок регрессии в Python
Введение в функции потерь
Обновление 30.05.2019: Чтобы проверить вещи, вы можете покопаться в документации, а иногда и в кодах, основываясь на ее документации .RandomForestRegressor , MSE - не что иное, как уменьшение дисперсии в качестве критерия выбора функции, даже если вы проверяете исходный код, он используется для измерения качества разделения . С другой стороны, если вы сомневаетесь относительно подхода MSE в .RandomForestRegressor
, вы можете использовать его самостоятельно, настроив criterion
следующим образом:
from sklearn.metrics import mean_squared_error
from sklearn.ensemble import RandomForestRegressor
#Feature Selection
criterion = mean_squared_error(y, predictions)
RandomForestRegressor( ...,criterion= criterion,...)
или используя numpy:
import numpy as np
criterion = np.mean((y_test - est.predict(X_test))**2)