Как создаются наземные рамки, ограничивающие правду, для набора данных для глубокого обучения? - PullRequest
1 голос
/ 22 января 2020

Я работаю над проектом, в котором я хотел бы использовать маску RCNN для идентификации объектов в наборе изображений. Но мне трудно понять, как создаются ограничительные рамки (закодированные пиксели) для наземных данных истинности. Кто-нибудь может указать мне правильное направление или объяснить это мне дальше?

1 Ответ

1 голос
/ 22 января 2020

Ограничительные рамки обычно обозначаются вручную. Большинство людей с глубокими знаниями используют отдельное приложение для тегирования. Я считаю, что этот пакет популярен:

https://github.com/AlexeyAB/Yolo_mark

Я разработал свое собственное решение RoR для тегирования, потому что полезно распределить работу среди нескольких человек. Репозиторий с открытым исходным кодом, если вы хотите взглянуть:

https://github.com/asfarley/imgclass

Я думаю, что это немного вводит в заблуждение называть это «кодированные пиксели». Ограничительные рамки представляют собой помеченный прямоугольником тип данных, что означает, что они полностью определяются типом (автомобиль, автобус, грузовик) и (x, y) координатами углов прямоугольника.

Программное обеспечение для определения границ -boxes обычно состоит из элемента отображения изображения, а также функций, позволяющих пользователю перетаскивать ограничивающие рамки на пользовательский интерфейс. Мое приложение использует список переключателей для выбора типа объекта (автомобиль, автобус и т. Д. c); тогда пользователь dr aws ограничивающий прямоугольник.

Результатом полной пометки изображения является текстовый файл, где каждая строка представляет один ограничивающий прямоугольник. Вы должны проверить документацию библиотеки для своего алгоритма обучения, чтобы точно понять, в каком формате вам нужно вводить ограничивающие рамки.

В своем собственном приложении я разработал некоторые функции для сравнения ограничительных рамок от разных пользователей. При любом большом усилии по ML вы, возможно, столкнетесь с некоторыми ошибочно маркированными изображениями, поэтому вам действительно нужен инструмент, чтобы определить это, поскольку он может серьезно ухудшить ваши результаты.

...