Я создал сеть для сегментации изображений, в частности опухолей головного мозга. Блокнот Jupyter с кодом здесь .
Когда я тренирую CNN с размером мини-партии 1, я получаю довольно хороший результат:
Но когда я изменяю размер на что-то большее (2 или более), результаты ужасны:
Тензорная доска показывает разницу в потерях. Очевидно, что сеть с пакетным размером 2 не сводит к минимуму потери (синий)
Любые идеи о том, почему это может иметь место?