Я только начал работать с набором данных сегментации VOC Паскаля. Но у меня проблемы с пониманием цветовой кодировки, которую они использовали при маркировке на земле. Я предполагал, что пиксели будут аннотированы от 1 до 20 для каждого класса, но я получил 8-разрядные изображения PNG глубиной со значениями пикселей (0-255).
Для определенного пикселя, принадлежащего классу aeroplane
в 2007_000033.png
, я получаю значения: (128, 0, 0); в то время как другой пиксель, принадлежащий классу train
в 2007_000123.png
, дает значения: (128, 0, 192) и т. д.
Как мне дифференцировать их по разным классам и выполнять горячее кодирование? Нужно ли указывать значения пикселей для каждого класса (например, поиск пикселей с помощью (128, 0, 0) и кодировать их как 1 для класса aeroplane
)?
Извините, я вижу несколько похожих вопросов по SO, но ничего мне не помогло. Спасибо.