Чрезмерно обработанные изображения, такие как карты Google или Bing, являются ужасным источником изображений для выполнения извлечения объектов или их распознавания. Обычно вам требуется максимально необработанная необработанная форма с моделями камер ... конечно, если у вас нет доступа к данным такого рода, вам придется работать с тем, что у вас есть.
Более важным соображением, связанным с Google Maps / Earth images, является то, что вы можете вступить в противоречие с их лицензионным соглашением. Я предлагаю вам проверить это, прежде чем вы определитесь с их данными в качестве источника изображений. В частности, если вы обойдете их API, вы нарушили их лицензионное соглашение.
Что касается библиотек и языков, то существуют десятки библиотек машинного зрения. Я не могу рекомендовать одно над другим, потому что я был только нижестоящим потребителем их результатов. Насколько я понимаю, проблема заключается в том, что наибольшую озабоченность вызывает то, как вы строите «модели» для сравнения ... то есть как вы даете системе «пример» того, что вы ищете.
Как только вы нашли библиотеку, вы можете принять решение о языке. Обычно для такого прототипирования используется язык высокого уровня, такой как Python или Matlab. Как только метод найден, выполняется преобразование в язык с более высокой производительностью - , если необходимо .
Лично я бы, вероятно, использовал Python, потому что (1) он находится в свободном доступе, (2) имеет значительное сообщество в научном и исследовательском мире и (3) может взаимодействовать с широким спектром языков и платформ.