Потеря - это расчет выходов вероятности и фактических классов, этот расчет не зависит от состояния тренировки любых последующих слоев.Под статусом я имею в виду trainable == True или trainable == False .
Обратное распространение потери используется в сочетании со скоростью обучения до корректируйте вес слоя, только если статус trainable == True .Ошибка все еще может проходить через эти слои, если между необучаемыми слоями есть обучаемые слои.Любые слои в вашей модели, которые «поддаются обучению», будут обновляться после каждого шага обучения.
При использовании Word2Vec веса импортируются в слой внедрения и много раз «замораживаются», чтобы не обновляться, пока остальныеиз параметров обучены.Однако к концу этого процесса иногда размораживание может привести к лучшим результатам.