Можно ли использовать Google Script для преобразования PDF без возможности поиска, расположенного на Google Диске, в PDF с возможностью поиска? - PullRequest
0 голосов
/ 09 июля 2019

Я бы хотел использовать Google Apps Spript для преобразования неисследуемых PDF-файлов в PDF-файлы с возможностью поиска, в которых текст наложен на PDF.

Файлы PDF находятся на моем Google Диске, и я не хочу загружать файлы на другой веб-сайт или загружать файлы, чтобы выполнить преобразование.

Я не нашел ни одного ресурса, показывающего, что текст может быть наложен аналогично тому, как Adobe Acrobat выполняет преобразование OCR. Итак, возможно ли сделать оверлей с использованием ГАЗА? Я видел только людей, конвертирующих в текстовый или документальный файл.

1 Ответ

0 голосов
/ 13 июля 2019

Гугл-диск имеет функцию распознавания текста, которая позволяет преобразовывать изображения / PDF без возможности поиска в файлы Google Docs при загрузке, а также функцию экспорта, которая позволяет экспортировать файлы Docs в PDF.Однако прямой метод преобразования отсутствует, и во время распознавания форматирование распознавания будет потеряно.Таким образом, невозможно создать PDF-файлы с наложением.

Лучше всего будет вызывать внешний OCR API через запрос POST или GET с UrlFetchApp.fetch() в скрипте приложений.Вы можете встроить метод в функцию, которая автоматически перебирает нужные вам дисководы, находит все файлы PDF и использует их URL-адреса для вызова внешнего API OCR.

...