Вопросы по Scikit-Learn ранней остановке - PullRequest
0 голосов
/ 12 июня 2019

У меня есть несколько вопросов по Scikit-Learn MLPRegressor , когда включена ранняя остановка:

  1. Выбраны ли данные проверки (см. 'Validation_fraction') случайным образом, спереди или сзади предоставленных данных испытаний?

  2. Являются ли данные проверки одинаковыми или разными во время последовательных итераций обучения?

  3. Будут ли данные проверки автоматически включаться / обновляться на последнем этапе обучения?

  4. Если оценка валидации не улучшится хотя бы на tol для последовательных эпох n_iter_no_change, будет ли возвращен предыдущий лучший регрессор или функция fit () просто вернет последний регрессор?

1 Ответ

1 голос
/ 12 июня 2019

Выбраны ли данные проверки (см. 'Validation_fraction') случайно, спереди или сзади предоставленных тестовых данных?

MLPRegressor использует train_test_split внутреннесоздать данные проверки.Если аргумент shuffle для MLPRegressor установлен в значение false, то дробь берется из конца тестовых данных.Если для shuffle установлено значение true, данные выбираются случайным образом.

Являются ли данные проверки одинаковыми или разными во время последовательных итераций обучения?

Данные проверки одинаковы для всех итераций обучения

Будут ли данные проверки автоматически включаться / обновляться на заключительном этапе обучения?

Данные проверки никогда не будут использоваться для обучения модели.Используется только для оценки модели.

Когда оценка валидации не улучшается, по крайней мере, tol для n_iter_no_change последовательных эпох, будет ли возвращен предыдущий лучший регрессор, или функция fit () просто возвратит последний регрессор?

Если оценка не улучшается, вместо продолжения ранняя остановка прекращает обучение модели (избегая переоснащения) и возвращает лучший параметр модели ( ссылка )

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...