Не удается распознать все объекты на изображении - PullRequest
0 голосов
/ 06 апреля 2019

В настоящее время я пытаюсь выполнить распознавание элементов управления видеопроигрывателя (например, «воспроизведение», «пауза», «перемотка вперед» и т. Д.). Я начал с небольшого набора данных (8 изображений), которые очень похожи, чтобы переоснастить модель, а затем расширить набор данных. Теперь я получаю правильное признание для некоторых типов элементов управления, но не для всех. И проблема в том, что объекты, которые я не могу воссоздать, всегда одинаковы! Поэтому возникает вопрос: есть ли какие-либо ограничения, ограничения, нюансы и т. Д., Связанные с обучением / признанием, которые я не знаю? Поскольку это не первая попытка получить правильное распознавание для этой задачи: я пробовал большой набор данных, я пытался поиграть со скоростью обучения и скоростью, изменил стратегию маркировки - она ​​всегда одинакова, один конкретный тип объектов игнорируется!

Я использую следующую команду для распознавания:

./flow --imgdir /tmp/test --model /root/darkflow/cfg/project.cfg --backup /root/darkflow/ckpt/project/ --load 21400 --labels /tmp/labels-project.txt

и это для обучения:

./flow --train --labels /tmp/labels-project.txt --annotation $TMP_DATA/ann --dataset $TMP_DATA/img --model $DARKFLOW_HOME/cfg/$MODEL.cf$
--load 17400 --gpu 1.0 --lr 1e-8 --keep 100 --backup $DARKFLOW_HOME/ckpt/$MODEL/  --save 300 --epoch 4000 --verbalise > /tmp/train_$MODEL.log &

Это то, что я не могу распознать (CC в сером (или синем) прямоугольнике на черном фоне). Размер может отличаться: введите описание изображения здесь

...