Машинное обучение + Python: кривая проверки чертежей - PullRequest
0 голосов
/ 09 октября 2018

Я хочу нарисовать кривую проверки для моего наивного байесовского оценщика следующим образом:

http://scikit -learn.org / stable / auto_examples / model_selection / plot_validation_curve.html

Я не понял, что такое оценка за тренировку.

Кто-нибудь может мне объяснить?

1 Ответ

0 голосов
/ 09 октября 2018

Учебный балл - это балл, полученный во время тренировки.Например, когда вы называете что-то вроде yourmodel.fit(x_train, y_train), в данном случае это оранжевая линия.За кулисами ваша модель делает прогнозы для ваших x_train данных (ваши характеристики, например, температура или влажность) относительно вашего y_train (ваши метки / результаты, например, дождь или отсутствие дождя). Очень приблизительно , результат обучения рассчитывается на основе того, сколько прогнозов выполнила ваша модель.Например, ваша модель может иметь оценку 0,9436 (примерно 94%), что означает, что ваша модель машинного обучения выдает правильное решение в 94% случаев.Вы часто обнаруживаете, что во время обучения модель имеет тенденцию получать более высокие оценки, чем на тестовом наборе.Вы можете видеть, что оранжевая линия выглядит так, как будто она находится на уровне 1,0, эффективно набирая 100%, но наивысшая оценка для перекрестной проверки (теста) составляет чуть менее 100%, что является более распространенным зрением.

Это может быть опаснопринять значение 1,0 означает, что ваша модель идеальна, и именно здесь переоснащение входит в фигуру, что на высоком уровне означает, что ваша модель слишком плотно вписывается в ваши тренировочные данные и не будет хорошо обобщать для новыхданные.Я бы порекомендовал заглянуть в этот для получения дополнительной информации, Sci-Kit узнает, что на сайте есть отличная документация.

...