Как бороться с нерелевантными изображениями в моем наборе данных - PullRequest
0 голосов
/ 01 апреля 2020

Я начинающий sh в области глубокого обучения (в настоящее время изучаю его по книгам pyimagesearch), и у меня есть набор данных с аннотациями (xml файлы).

Моя проблема заключается в следующем: у меня не такое же количество изображений, как у xml файлов. Я посмотрел поближе и предположил, что соответствующие изображения (с отсутствующими файлами xml) не имеют отношения к обучению.

Пример: я должен заметить трещины и ржавчину на стенах (которые есть в моем наборе данных ) и на некоторых рисунках изображен мост под голубым небом.

Итак, мой вопрос, как быть с этими снимками? Должен ли я создать отсутствующие xml файлы и заполнить их «пустыми» ограничивающими рамками? Если да, какие координаты мне следует указать? Я предполагаю, что набор данных сделан хорошо и не должен генерировать больше файлов xml, но в этом случае я не знаю, как обращаться с набором данных, включая нерелевантные изображения.

Насколько я знаю, пример в книгах pyimagesearch не используйте наборы данных с нерелевантными изображениями.

Спасибо за помощь и извиняюсь за мой английский sh, это не мой родной язык

1 Ответ

0 голосов
/ 02 апреля 2020

Вы можете начать с удаления ненужных изображений и обучить модель существующим файлам. xml и соответствующим изображениям.

Нет необходимости помещать ограничивающий прямоугольник на изображения, не имеющие целевых классов и подачи это к модели.

Прокомментируйте, если у вас есть дополнительные проблемы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...