Модель CNN на наборе данных cifar10, кажется, не обучена - PullRequest
0 голосов
/ 26 октября 2018

Я просто хотел взглянуть на простое руководство по cnn, и я хочу обучить свою сеть, состоящую из 5 фильтров (3 слоя конв и 2 плотных слоя), за которыми следуют слои max_pool и выпадающие слои.

Моя проблема в том, что моя сеть, кажется, не обучена вообще, и я не могу найти, где проблема ....

Я поставлю все свои коды (модель train.py test.py.py и main.py) по следующей ссылке на github.

https://github.com/mmecoco/tensorflow_cnn_cifar10

Помогите мне ...

1 Ответ

0 голосов
/ 26 октября 2018

Я только что обнаружил свою проблему, это было связано с моим последним слоем fc, проблема заключалась в том, что я пытался применить активацию softmax к своему выходу, и если я использую функцию кросс-энтропийной потери softmax, значение моей потери будет быть на стороне -инф или инф. Из-за этого сети прекращают учебный процесс, и именно поэтому я провалил свое обучение.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...