Я пытаюсь создать простой детектор объектов для использования dlib.simple_object_detector()
для python. Объект для распознавания - это человеческие лица, полученные с левой стороны.
Эти профили человеческих лиц предварительно обрезаны, то есть доступные мне изображения содержат только профили, а не тело или фон.
Я создал сценарий для генерации необходимого .xml
файла, содержащего информацию об изображении, где ограничивающая рамка похожа на размер изображения; структура файла идентична той, которая создается инструментом imglab
, как показано в примерах dlib
.
Когда детектор обучен, результат не может быть обобщен на изображения в дикой природе, т.е. когда я пытаюсь обнаружить профили лиц на некоторых фотографиях, сгенерированные мной ограничивающие рамки либо отсутствуют, либо не подходят.
Итак, вот мои вопросы:
- В
.xml
файлов Я ввел весь путь, ведущий к каждому изображению, а не запускал детектор с пути изображения. Влияет ли это на тренировочный процесс? Кроме того, я не добавил метку к изображениям. - Есть ли способ использовать такой набор данных для создания детектора, или необходимо иметь набор данных с дополнительной информацией об объектах обнаружения, т.е. некоторые части тела и фона?
- Если требуется дополнительная справочная информация, должна ли она быть естественной, или я могу просто интегрировать обрезанные профили лица в некоторые случайные изображения и запустить обнаружение?
- Наконец, должны ли ограничивающие рамки быть прямоугольниками одинакового размера и / или формата крысы? ios?