взгляните на опцию контрольной точки, подробности о том, как это работает, можно найти в руководстве пользователя здесь
. Я сделаю репост некоторых материалов для вашего удобства:
В реальных сценариях данные могут изменяться.Например, у вас может быть модель, которая в настоящее время находится в производстве, которая была построена с использованием 1 миллиона записей.Позже вы можете получить еще несколько сотен тысяч записей.Вместо создания новой модели с нуля можно использовать параметр контрольной точки для создания новой модели на основе существующей модели.
Параметр контрольной точки доступен для DRF, GBM и DeepАлгоритмы обучения.Это позволяет вам указать ключ модели, связанный с ранее обученной моделью.Это создаст новую модель как продолжение ранее сгенерированной модели.Если это не указано, то алгоритм начнет обучение новой модели вместо продолжения построения предыдущей модели.
При настройке параметров, которые продолжают строить на предыдущей модели, в частности, ntrees (в GBM / DRF) или эпохах (в Deep Learning), укажите общее количество тренировок, которое вы хотите, если вы начали с нуля, а не количество дополнительных эпох или деревьев, которые вы хотите.Обратите внимание, что это означает, что параметр ntrees или epochs для модели с контрольными точками всегда должен быть больше исходного значения.Например:
Если первая модель строит 1 дерево, и вы хотите, чтобы ваша новая модель строила 50 деревьев, то в модели продолжения (с использованием контрольных точек) будет указано ntrees = 50.Это дает вам в общей сложности 50 деревьев, включая 49 новых.Если ваша исходная модель содержала 20 деревьев, и вы указали ntrees = 50 для модели продолжения, то новая модель добавит в модель 30 деревьев, что снова даст вам 50 деревьев.
Если ваша оригинальная модель включала 20 деревьев, и вы указали ntrees = 10 (более низкое значение), то вы получите сообщение об ошибке, указывающее, что запрашиваемые ntrees должны быть выше 21.