OCR PDF-файлы Использование Google Cloud Vision? - PullRequest
0 голосов
/ 15 сентября 2018

Существуют ли в настоящее время какие-либо службы или программные средства, которые используют Google Cloud Vision в качестве бэкэнда для распознавания отсканированных PDF-файлов?

Если нет, то как можно было бы использовать Google Cloud Vision для преобразования PDF-файлов в документы с оптическим распознаванием? Насколько я знаю, Cloud Vision в настоящее время поддерживает файлы PDF, но выводит распознанный текст только в виде файла JSON. Таким образом, кажется, что нужно будет выполнить дополнительный шаг, поместив этот преобразованный текст поверх изображения внутри PDF-файла вне Google Cloud Vision, на отдельном этапе.

Справочная информация:

Мне часто приходится конвертировать PDF-файлы отсканированных документов в PDF-файлы, содержащие текстовый слой OCRed. До сих пор я использовал программное обеспечение, такое как OCRKit или ABBYY FineReader. Я проверил точность этих решений в сравнении с возможностями распознавания текста в Google Cloud Vision, и последняя вышла далеко вперед.

1 Ответ

0 голосов
/ 07 ноября 2018

Как вы хорошо заметили, ответы , полученные с помощью API Vision , доступны только в формате JSON ; поэтому необходимо создать дополнительный шаг в своем решении, используя сторонние библиотеки , чтобы создать файл PDF на основе содержимого ответа.

Если эта функция не отвечает вашим текущим потребностям, вы можете использовать кнопку Отправить отзыв , расположенную в нижнем левом и верхнем правом углах общедоступной документации службы , а также взгляните на инструмент Issue Tracker , чтобы поднять запрос функции Vision API и уведомить Google об этой желаемой функциональности.

...