Допустим, у меня есть обучающий образец (с соответствующими ярлыками обучения) для определенной нейронной сети (архитектура нейронной сети не имеет значения для ответа на этот вопрос). Давайте назовем нейронную сеть «моделью».
Чтобы не создавать недоразумений, допустим, что я ввел начальные веса и смещения для «модели».
Эксперимент 1.
Я использую тренировочный образец и учебные ярлыки, чтобы обучить «модель» в течение 40 эпох. После обучения нейронная сеть будет иметь определенный c набор весов и смещений для всей нейронной сети, назовем его WB_Final_experiment1.
Эксперимент 2
Я использую обучающий образец и учебные ярлыки для обучения «модели» на протяжении 20 эпох. После обучения нейронная сеть будет иметь определенный c набор весов и смещений для всей нейронной сети, назовем его WB_Intermediate.
Теперь я представляю WB_Intermediate в «модели» и тренируюсь еще на 20 эпох , После обучения нейронная сеть будет иметь определенный c набор весов и смещений для всей нейронной сети, назовем это WB__Final_experiment2.
Соображения. Каждый отдельный параметр, гиперпараметр, функции активации, функции потерь ... абсолютно одинаковы для обоих экспериментов, кроме эпох.
Вопрос: WB_Final_experiment1 и WB__Final_experiment2 точно одинаковы?