Показано, что нормализация партии помогает во многих случаях, но не всегда оптимальна. Я обнаружил, что это зависит от того, где он находится в вашей модели архитектуры и чего вы пытаетесь достичь. Я много сделал с различными CNN GAN и обнаружил, что часто BN не нужен и может даже ухудшить производительность. Его цель - помочь модели быстрее обобщаться, но иногда это увеличивает время обучения. Если я пытаюсь копировать изображения, я полностью пропускаю BN. Я не понимаю, что вы имеете в виду в отношении точности. Вы имеете в виду, что он достиг 83% точности с данными обучения, но упал до 15% точности данных валидации? Какова была точность проверки без BN? В целом, точность проверки является наиболее важной метрикой c. Если у вас высокая точность обучения и низкая точность проверки, вы действительно переоснащаетесь. Если у вас есть несколько слоев свертки, вы можете применить BN после каждого. Если вы по-прежнему переусердствовали, попробуйте увеличить ваши успехи и размер ядра. Если это не сработает, вам может понадобиться снова посмотреть на данные и убедиться, что их достаточно, и что они несколько разнообразны. Предполагая, что вы работаете с данными изображений, вы создаете образцы, в которых вы поворачиваете изображения, обрезаете их и т. Д. c. Рассмотрите синтетические c данные, чтобы увеличить ваши реальные данные, чтобы помочь бороться с перегрузкой.