Обучение оптическому распознаванию компьютерного зрения - PullRequest
0 голосов
/ 29 мая 2020

Я установил Azure Службу компьютерного зрения и использовал в своем приложении. Когда я попытался выполнить оптическое распознавание текста для некоторых изображений, он не распознал весь текст (то есть пропустил букву «S» в «чашках»). Можно ли обучить / переобучить в OCR, если текст не распознается правильно?

Ответы [ 2 ]

0 голосов
/ 29 мая 2020

Основываясь на предоставленном вами изображении и информации, я быстро проверил вывод Computer Vision API, в котором есть несколько операций для обработки текста:

  • OCR: исходный, синхронный
  • Распознать текст: второй, асинхронный, который будет устаревшим для последнего
  • Пакетное чтение (2.0 и 2.1)> Чтение (3.0): последнее, также асинхронное.

С точки зрения качества результатов операция чтения лучше, особенно для повернутых элементов и других случаев.

Вот пример вывода каждого из них с вашим изображением (https://moderatorsampleimages.blob.core.windows.net/samples/sample2.jpg), созданный с помощью Cognitive Workbench веб-сайта , демонстрации Cognitive Services с открытым исходным кодом.

OCR

Ocr

Вы можете увидеть некоторые ошибки:

  • после «CAPABLE» стоит «*»
  • «OURSELVE» не хватает «S»
  • Последний точка - запятая

Распознать текст

RecognizeText

Здесь Проблема заключается в отсутствии периода в конце

Пакетное чтение

BatchRead

Здесь единственной проблемой является отсутствие периода в конце

Вывод: используйте версию Read 3.0, которая теперь общедоступна. Ссылка API: https://westeurope.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-ga/operations/5d986960601faab4bf452005

0 голосов
/ 29 мая 2020

Это не всегда тот случай, когда инструменты распознавания текста могут все обнаружить. Вы можете попробовать предварительно обработать некоторые изображения перед их отправкой на azure. Предварительная обработка

...