Что означает эта разница в баллах? - PullRequest
0 голосов
/ 22 октября 2019

Я построил модель линейной регрессии, я получаю две разные оценки для набора «Поезд» и «Проверка». Что это значит? Это результат, который я получил. Оценка данных поезда: 0,8802644749581061 Оценка данных проверки: 0,7124061878004602

ПРИМЕЧАНИЕ: - Я еще не использовал свой набор тестов.

Я построил модель ML (ЛинейныйРегрессия), затем я проверил счет по обучающей части и проверочной части:

reg = LinearRegression().fit(X_train, y_train)
reg.score(X_train, y_train)

Это то, что получается из этой строки кода:

Данные поезда: 0.8802644749581061

Данные проверки: 0,7124061878004602

1 Ответ

0 голосов
/ 22 октября 2019

С веб-сайта scikit-learn мы можем узнать, что оценка:

Возвращает коэффициент определения R ^ 2 прогноза.

коэффициент R ^ 2 определяется как (1 - u / v), где u - остаточная сумма квадратов ((y_true - y_pred) ** 2) .sum (), а v - общая сумма квадратов ((y_true - y_true).mean ()) ** 2) .sum (). Наилучшая возможная оценка - 1,0, и она может быть отрицательной (поскольку модель может быть произвольно хуже). Постоянная модель, которая всегда прогнозирует ожидаемое значение y, независимо от входных характеристик, получит оценку R ^ 2 0,0.

В вашем случае значение R ^ 2 обучающих данных вышечем данные проверки, что означает, что модель переоснащается.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...