Я пытался обучить набор пользовательских весов, используя объекты из набора данных COCO и набор пользовательских объектов с ~ 1000 обучающими изображениями каждое, но после 50 000, 100 000 и 200 000 итераций обучения я все еще не получаю любые полезные результаты. Вот что я попробовал:
- Взяв новые изображения и их текстовые файлы с соответствующими именами и метками и поместив их в те же папки, что и обучающие и проверочные изображения COCO, а также папки с метками
- Созданы файлы train.txt и valid.txt с абсолютными путями к изображениям в указанных выше папках.
- Удалены некоторые классы из файла coco.names и добавлены пользовательские объекты в его конец
- Запустил скрипт, который изменил все метки в файлах, чтобы они соответствовали новой настройке файла coco.names
- Изменен файл yolov3.cfg следующим образом:
- Set batch = 64
- Установите подразделения = 8
- Установите max_batches на 2000 * количество классов
- Установите шаги = 80% от max_batches (например, 2000 max_batches будет 1600 шагов)
- Установить классы = количество объектов в каждом из 3 слоев [yolo]
- Установить фильтры = (количество классов + 5) * 3 в каждом из 3 [сверточных] перед каждым слоем [yolo]
- И начал тренироваться Воспользуйтесь возможностью обучения передаче с darknet53.conv.74 на 4 графических процессорах для первых 20,00 итераций, затем на 8 графических процессорах после этого
Каждый фрагмент документации, который я видел на YOLO / Dar knet скажем что это способ go об обучении, но это не правильно что-либо помечает (объекты COCO или иное). Если предположить, что метки и структура файлов правильны для этих данных обучения (я проверял это несколько раз), что я могу изменить, чтобы попытаться исправить свои результаты?