Тензор потока потерь NAN - PullRequest
0 голосов
/ 28 июня 2018

Я обучаю задачу регрессии ограничивающего прямоугольника и использую компонент координат функции потерь, описанной в статье YOLO .

Метод 1: Использовать вектор признаков HOG в качестве входных данных для ANN. Та же функция потери. Дали мне хорошую модель.

Метод 2: Использованные изображения в качестве входных данных для CNN. Конечный слой остается таким же, как в методе 1. Та же функция потерь также. Но я сталкиваюсь как проблема с подсчетом потерь. Это печать наноструктур для обучения, разработки и тестирования, начиная с самой первой эпохи.

Как мне заставить CNN работать, когда та же самая функция потерь работает с ANN на отлично? И в чем может быть причина такого происшествия? Я хотел бы иметь возможность использовать ту же функцию потерь.

1 Ответ

0 голосов
/ 28 июня 2018

Если предположить, что функция потерь хорошо реализована, из моего опыта проблемы с потерей обычно связаны либо с неверными входными данными (т. Е. Из-за какой-то операции по увеличению данных или из-за других ошибок ваши данные выглядят очень плохо), либо из-за вашей скорости обучения слишком высоко Попробуйте уменьшить скорость обучения; если это не сработает, сделайте хорошую отладку и убедитесь, что данные «точно», как вы ожидаете, непосредственно перед тем, как они поступают в нейронную сеть.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...