Существуют ли в настоящее время какие-либо службы или программные средства, которые используют Google Cloud Vision в качестве бэкэнда для распознавания отсканированных PDF-файлов?
Если нет, то как можно было бы использовать Google Cloud Vision для преобразования PDF-файлов в документы с оптическим распознаванием? Насколько я знаю, Cloud Vision в настоящее время поддерживает файлы PDF, но выводит распознанный текст только в виде файла JSON. Таким образом, кажется, что нужно будет выполнить дополнительный шаг, поместив этот преобразованный текст поверх изображения внутри PDF-файла вне Google Cloud Vision, на отдельном этапе.
Справочная информация:
Мне часто приходится конвертировать PDF-файлы отсканированных документов в PDF-файлы, содержащие текстовый слой OCRed. До сих пор я использовал программное обеспечение, такое как OCRKit или ABBYY FineReader. Я проверил точность этих решений в сравнении с возможностями распознавания текста в Google Cloud Vision, и последняя вышла далеко вперед.