Я пытаюсь использовать набор данных KAIST в PyTorch для обучения модели и генерирования весов. Я новичок в Python и PyTorch, и я борюсь с использованием загрузчиков данных с таким набором данных. Набор данных поставляется с файлами изображений png, но аннотации (метки и ограничивающие рамки) представлены в формате .vbb, и у меня возникают проблемы с преобразованием в удобную форму (например, csv, текстовый файл и т. Д.). Поэтому я предполагаю, что мой первый вопрос заключается в том, как мне преобразовать аннотации в формат, в котором я могу перебирать файл png с их ассоциированными аннотациями. Второй вопрос: как мне создать загрузчик данных для этого набора данных в PyTorch.
Любой совет будет принята с благодарностью.
Ссылка на набор данных - https://github.com/SoonminHwang/rgbt-ped-detection/tree/master/data
Существует метод преобразования аннотаций, приведенных в ссылке выше, но мне не удалось получить его для получения правильных результатов. Возможно, есть более простой способ конвертации через python?