Я практикую проблему контролируемой классификации с сетью CNN
Простая структура NN: 5 (высота) * 72 (ширина) вход -> 5 * 4 ядро -> 1 * 2 пул - > Relu ==> 1 * 3 kernel -> Relu ==> f c -> 42 output ==> softmax ==> 1 max output
Оптимизатор Адама, learning_rate = 0,001.
Исходный ввод довольно скудный, соотношение (значение пикселя == 0)> 2/3.
Следуя некоторым инструкциям, я попытался переписать NN небольшим набором данных.
NN хорошо работал с 256 выборками (точность = 0,95), но не смог сойтись с 1024 выборками. В случае с 1024 примерами 2-й слой Convolution генерировал вывод с нулем.
Я также пробовал (3 * 3) ядра, которые генерировали аналогичный результат.
Что мне делать рядом, чтобы обнаружить проблему? Неужели проблема кроется в редком входе, с которым CNN плоха?
Большое спасибо!