Я обучаю задачу регрессии ограничивающего прямоугольника и использую компонент координат функции потерь, описанной в статье YOLO .
Метод 1: Использовать вектор признаков HOG в качестве входных данных для ANN. Та же функция потери. Дали мне хорошую модель.
Метод 2: Использованные изображения в качестве входных данных для CNN. Конечный слой остается таким же, как в методе 1. Та же функция потерь также. Но я сталкиваюсь как проблема с подсчетом потерь. Это печать наноструктур для обучения, разработки и тестирования, начиная с самой первой эпохи.
Как мне заставить CNN работать, когда та же самая функция потерь работает с ANN на отлично? И в чем может быть причина такого происшествия? Я хотел бы иметь возможность использовать ту же функцию потерь.