Pascal VOC Class Segmentation: наземная пиксельная маркировка для обучения - PullRequest
0 голосов
/ 09 мая 2018

Я только начал работать с набором данных сегментации VOC Паскаля. Но у меня проблемы с пониманием цветовой кодировки, которую они использовали при маркировке на земле. Я предполагал, что пиксели будут аннотированы от 1 до 20 для каждого класса, но я получил 8-разрядные изображения PNG глубиной со значениями пикселей (0-255).

Для определенного пикселя, принадлежащего классу aeroplane в 2007_000033.png, я получаю значения: (128, 0, 0); в то время как другой пиксель, принадлежащий классу train в 2007_000123.png, дает значения: (128, 0, 192) и т. д.

Как мне дифференцировать их по разным классам и выполнять горячее кодирование? Нужно ли указывать значения пикселей для каждого класса (например, поиск пикселей с помощью (128, 0, 0) и кодировать их как 1 для класса aeroplane)?

Извините, я вижу несколько похожих вопросов по SO, но ничего мне не помогло. Спасибо.

1 Ответ

0 голосов
/ 04 августа 2018

Я поднял себе подобный вопрос, который довольно долго меня смущал.И я думаю, что нашел возможное объяснение:

Если вы посмотрите на file_download_and_convert_voc2012.sh , есть строки, помеченные " # Удалите цветовую карту в основных аннотациях истинности ».В этой части обрабатываются исходные файлы SegmentationClass и создаются необработанные файлы сегментированных изображений, каждый пиксель которых имеет значение от 0: 20. (Если вы можете спросить, почему, проверьте этот пост: Python: использование PIL для загрузки файла png дает странные результаты)

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...