Распознать Lo go в полном изображении - PullRequest
0 голосов
/ 27 февраля 2020

Во-первых, вам нужно знать, что я новичок в этом предмете. Изначально я являюсь разработчиком встроенных систем, но никогда не работал с распознаванием изображений.

Позвольте мне изложить свою главную цель:

  • Я хотел бы создать свою собственную базу данных логотипов и быть в состоянии распознать их в увеличенном изображении. Типичным приложением может быть, например, создание базы данных логотипов пепси и логотипов кока-колы, и когда я фотографирую bottle соды, он говорит мне, один из них или другой.

Итак, вот моя проблема:

  • Сначала я хотел использовать Google Auto Kit Kit. Я дал ему свои базы данных, чтобы он мог тренироваться сам. Моей первой попыткой было сделать фотографии bottle полностью, а затем сравнить. Это было хорошо, но не слишком эффективно. Затем я попытался дать ему только логотипы, но после тренировки он не смог распознать что-либо по всему изображению bottle.

Я думаю, что я не дал достаточно изображений в первом случае. Но я бы предпочел использовать второй случай (давая только lo go), чтобы машина искала что-то похожее на изображении.

Наконец, мои вопросы:

  • Если вы работали с ML Kit от Google, смогли ли вы обучить модель, дав изображения, которые должны быть распознаны на увеличенном изображении? Если да, есть ли у вас какие-либо подсказки, чтобы дать мне?
  • Знаете ли вы надежное программное обеспечение, которое могло бы помочь мне выполнять тесты такого рода? Я подумал о Azure Machine Learning Studio от Microsoft (так как я разрабатываю для Visual Studio).

В первый раз я хотел бы написать как можно меньше кода только для тестирования. Возможно, позже я смогу попробовать написать свою собственную Систему машинного обучения, но я думаю, что это большая проблема. Я также подумал, что мне нужно разделить свое изображение на более мелкое изображение, а затем отправить каждое из этих изображений в устройство, но это займет много времени и мне потребуется быстрая реакция (например, <2 секунды). </p>

Спасибо заранее за ваш ответ. Мне не нужен полный ответ с полным руководством (Stack Overflow не предназначен для этого в любом случае ^^), но только некоторые советы уже были бы хороши.

Хорошего дня!

1 Ответ

1 голос
/ 28 февраля 2020

Пользовательское видение Azure отлично подходит для этого: https://www.customvision.ai

Допустим, вы хотите обнаружить пепси-ло go. Загрузите 70 изображений товаров с логотипом lo go. Используйте Custom Vision, чтобы нарисовать рамку вокруг lo go для каждой фотографии. Нажмите «train», и вы получите модель тензорного потока с кодом.

Найдите любой учебник, он довольно невероятный и очень простой в использовании.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...