Я использую набор данных клеток крови. Модель SSD512 (предварительно обученная на наборе данных ImageNet). Обучение не дает приличной точности, иногда, даже если ему удастся обучить, потеря и проверка будут равны Nan, или проверка будет равна 0. Я ранее использовал SSD300 для того же набора данных и достигал нормальных результатов. Те же настройки гиперпараметров не работают для SSD512.
Что я пробовал:
- Скорость обучения .001 или выше возвращает Нан для потери и проверки. Только .0001 или меньше, кажется, может обучить модель.
- Я пытался использовать другие оптимизаторы, кроме MomentumSGD. Адам возвращает значения Нан. Другие оптимизаторы возвращают 0 проверки (ничего не изучая).
Вы можете проверить код здесь: Ссылка
Вы также можете проверить код SSD300 здесь: Ссылка
Какую настройку гиперпараметра мне нужно здесь сделать? Любые указатели, чтобы понять, почему SSD512 ведет себя странно на одном и том же наборе данных, будут полезны.