Извлечение возможных местоположений домов в изображениях улиц Google - PullRequest
0 голосов
/ 29 мая 2019

Я работаю над проектом, в котором я пытаюсь определить, содержит ли изображение улицы Google вид определенного стиля архитектуры дома (Vancouver Special) и где экземпляры указанного дома находятся на изображении (если дом на изображении). У меня нет доступа к графическому процессору, поэтому я пытаюсь использовать методы, которые могут быть разумно выполнены на процессоре с использованием Python (до сих пор я использовал OpenCV для реализации) - поэтому такие методы, как YOLO, в настоящее время недоступны , Моя основная идея состоит в том, чтобы сначала попытаться определить, где дом может находиться на изображении улицы, затем обрезать эти предложенные регионы и провести их через предварительно обученный классификатор CNN - что-то вроде классификатора RCNN, но с очень конкретной предварительной информацией о какой объект я ищу.

Мне удалось получить приличную оценку классификации, когда я тренировался на изображениях домов, которые находятся очень близко, например, здесь (http://www.vancouverspecial.com/images/3976beatrice.JPG).

С учетом вышесказанного у меня возникают проблемы с поиском возможных мест расположения домов на изображениях улиц. Я попробовал детектор краев Canny, но это не удалось, потому что края домов не решались хорошо, кажется, что на изображениях улиц слишком много информации, чтобы это работало. Я также попытался использовать полу-популярный алгоритм сегментации на основе графов, используемый в RCNN (https://link.springer.com/article/10.1023/B:VISI.0000022288.19776.77), но количество возможных областей, которые он выводит, слишком много для разумного времени работы процессора.

Моя главная проблема - оттачивать эффективные методы, так как, кажется, существует много подходов к этому - таких как обнаружение краев, поиск контуров и сегментация; с каждым из этих подходов, имеющих много разных методов. Кажется, трудно найти метод, который может работать с изображениями, например, с улицы Google. Большинство изображений с видом на улицу содержит много объектов, таких как дома, люди, деревья, трава и т. Д. И любой из них может частично покрывать дом. Дома также выглядят под разными углами, поэтому кажется, что поиск объектов, которые соответствуют только прямоугольной форме и невозможным преобразованиям типа сдвига, не будет очень эффективным. Поэтому мой вопрос: каковы возможные методы CV, которые можно использовать и внедрять в Python, которые будут возвращать возможные местоположения домов из изображений Google Street View с разумной точностью? До сих пор я пытаюсь использовать методы, которые не используют ML, чтобы найти регионы.

Спасибо

...