При обучении многослойных нейронных сетей, использующих обратное распространение, веса всех слоев обновляются в каждой итерации.
Я думаю, если мы случайным образом выберем какой-либо слой и обновим веса этого слоя только в каждой итерацииобратного распространения.
Как это повлияет на время тренировки?Не страдает ли производительность модели (возможности обобщения модели) от этого типа обучения?
Моя интуиция заключается в том, что возможности обобщения будут такими же, а время обучения будет сокращено.Пожалуйста, исправьте, если я ошибаюсь.