Я хочу реализовать детектор глубокого обучения светофорам c, используя систему обнаружения Yolo. Чтобы было понятно, обнаружение только с одним классом. Другое условие - это имеет для реализации в Keras, поэтому мне придется написать всю модель и циклы обучения / тестирования.
- Имеет ли смысл использовать предварительно обученный Imag eNet весов для этого?
- Если я использую предварительно обученные веса для дар knet, можно ли сделать их совместимыми с моей реализацией?
В бумаге yolo они используют предварительную подготовку с 20 первыми сверточными + пулом и f c слоями. Когда они делают обнаружение, они добавляют 4 сверточных слоя и 2 f c, которые выполняют регрессию и классификацию ограничивающего прямоугольника. Поэтому, если я понимаю, что шаги будут
- Предварительная подготовка системы с использованием большого набора данных
- Измените последние слои, чтобы выполнить регрессию ограничивающего прямоугольника, и повторите обучение
- Протестируйте систему
На шаге 1) как выглядят входы и выходы? Является ли входное изображение только рассматриваемым объектом и баллами выходного класса?
На шаге 2) мы тренируем только веса добавленных слоев или всей сети?