Предварительно обученная модель не обучается - PullRequest
0 голосов
/ 27 марта 2019

Я использую набор данных клеток крови. Модель SSD512 (предварительно обученная на наборе данных ImageNet). Обучение не дает приличной точности, иногда, даже если ему удастся обучить, потеря и проверка будут равны Nan, или проверка будет равна 0. Я ранее использовал SSD300 для того же набора данных и достигал нормальных результатов. Те же настройки гиперпараметров не работают для SSD512.

Что я пробовал:

  1. Скорость обучения .001 или выше возвращает Нан для потери и проверки. Только .0001 или меньше, кажется, может обучить модель.
  2. Я пытался использовать другие оптимизаторы, кроме MomentumSGD. Адам возвращает значения Нан. Другие оптимизаторы возвращают 0 проверки (ничего не изучая).

Вы можете проверить код здесь: Ссылка

Вы также можете проверить код SSD300 здесь: Ссылка

Какую настройку гиперпараметра мне нужно здесь сделать? Любые указатели, чтобы понять, почему SSD512 ведет себя странно на одном и том же наборе данных, будут полезны.

...