Основываясь на предоставленном вами изображении и информации, я быстро проверил вывод Computer Vision API, в котором есть несколько операций для обработки текста:
- OCR: исходный, синхронный
- Распознать текст: второй, асинхронный, который будет устаревшим для последнего
- Пакетное чтение (2.0 и 2.1)> Чтение (3.0): последнее, также асинхронное.
С точки зрения качества результатов операция чтения лучше, особенно для повернутых элементов и других случаев.
Вот пример вывода каждого из них с вашим изображением (https://moderatorsampleimages.blob.core.windows.net/samples/sample2.jpg), созданный с помощью Cognitive Workbench веб-сайта , демонстрации Cognitive Services с открытым исходным кодом.
OCR
Вы можете увидеть некоторые ошибки:
- после «CAPABLE» стоит «*»
- «OURSELVE» не хватает «S»
- Последний точка - запятая
Распознать текст
Здесь Проблема заключается в отсутствии периода в конце
Пакетное чтение
Здесь единственной проблемой является отсутствие периода в конце
Вывод: используйте версию Read 3.0, которая теперь общедоступна. Ссылка API: https://westeurope.dev.cognitive.microsoft.com/docs/services/computer-vision-v3-ga/operations/5d986960601faab4bf452005