Нормализация партии во время тестирования - PullRequest
0 голосов
/ 01 августа 2020

Я работаю над проблемой 2d временных рядов с размером вектора 140 * 6 для двоичной классификации с использованием CNN. Я не использовал какие-либо методы масштабирования и нормализации, вместо этого напрямую передавал данные в CNN с 3 скрытыми слоями и уровнями пакетной нормализации с размером пакета 256 во время обучения. Так как я должен тестировать его в реальном времени, а также с размером пакета 1, как будет работать пакетная нормализация затем не рассчитав какое-либо среднее или стандартное отклонение для какого-либо обучающего слоя. А также следует ли впоследствии использовать пакетную нормализацию для прямого прохода во время финального тестирования или только среднее и стандартное отклонение должны быть рассчитаны и использованы для обучающих слоев.

1 Ответ

0 голосов
/ 02 августа 2020

Пакетная нормализация при тестировании не используется. Причина этого в том, что пакетная нормализация используется для решения проблемы ковариационного сдвига между разными пакетами обучающих данных. Ковариационный сдвиг приводит к обучению плохих моделей, поэтому мы его используем. Он не играет роли во время тестирования.

И если вы использовали пакетную нормализацию с размером пакета 1, то это просто нормализация экземпляра.

...