Тренировка YOLO / Dar knet с сочетанием данных COCO и пользовательских данных обучения - PullRequest
0 голосов
/ 10 февраля 2020

Я пытался обучить набор пользовательских весов, используя объекты из набора данных COCO и набор пользовательских объектов с ~ 1000 обучающими изображениями каждое, но после 50 000, 100 000 и 200 000 итераций обучения я все еще не получаю любые полезные результаты. Вот что я попробовал:

  • Взяв новые изображения и их текстовые файлы с соответствующими именами и метками и поместив их в те же папки, что и обучающие и проверочные изображения COCO, а также папки с метками
  • Созданы файлы train.txt и valid.txt с абсолютными путями к изображениям в указанных выше папках.
  • Удалены некоторые классы из файла coco.names и добавлены пользовательские объекты в его конец
  • Запустил скрипт, который изменил все метки в файлах, чтобы они соответствовали новой настройке файла coco.names
  • Изменен файл yolov3.cfg следующим образом:
    • Set batch = 64
    • Установите подразделения = 8
    • Установите max_batches на 2000 * количество классов
    • Установите шаги = 80% от max_batches (например, 2000 max_batches будет 1600 шагов)
    • Установить классы = количество объектов в каждом из 3 слоев [yolo]
    • Установить фильтры = (количество классов + 5) * 3 в каждом из 3 [сверточных] перед каждым слоем [yolo]
  • И начал тренироваться Воспользуйтесь возможностью обучения передаче с darknet53.conv.74 на 4 графических процессорах для первых 20,00 итераций, затем на 8 графических процессорах после этого

Каждый фрагмент документации, который я видел на YOLO / Dar knet скажем что это способ go об обучении, но это не правильно что-либо помечает (объекты COCO или иное). Если предположить, что метки и структура файлов правильны для этих данных обучения (я проверял это несколько раз), что я могу изменить, чтобы попытаться исправить свои результаты?

...