Лучший способ конвертировать PDF-файл любой версии в отсканированный / распрямленный PDF-файл - PullRequest
0 голосов
/ 26 февраля 2019

Я хотел бы знать, есть ли способ, который поможет мне преобразовать PDF, который не сканируется (может быть изменен в Acrobat Pro), в файл, который сканируется / выравнивается (не может быть отредактирован в Acrobat Pro).

Я использую библиотеку FPDF, но кажется, что она не может распознать, сжимается ли PDF или нет, и в зависимости от этого он вызывает некоторые другие действия.

Я пыталсяЯ лучше всего изучаю библиотеку FPDF, и я думаю, что она проверяет позицию 'xref' и решает, какие шаги следует предпринять.Но в моем случае у меня есть 2 файла, один выровнен, а другой нет, и FPDF не может определить разницу.Оба эти файла имеют версию 1.4.Я также читал, что FPDF имеет ограничение обработки PDF-файлов, которые являются только версии 1.4.

1 Ответ

0 голосов
/ 26 февраля 2019

Вы можете использовать устройство Ghostscript pdfimage, которое будет рендерить весь контент в изображение, а затем обернуть его в файл PDF.Нет абсолютно никакой возможности извлечь что-либо из этого без запуска через программное обеспечение OCR.Это «звучит неправдой», что вы хотите, хотя трудно быть уверенным.

Боюсь, что я не думаю, что ваше понимание «сплющенного» может быть правильным.Все PDF-файлы будут иметь внешнюю ссылку, поэтому наличие или отсутствие такого ключевого слова не говорит вам, является ли PDF «сплющенным», независимо от того, что ваш пользователь / менеджер подразумевает под этим довольно расплывчатым термином.

Отсутствие'xref' может означать, что файл является версией PDF 1.5 или выше и использует сжатый xref.Ничего общего с его выравниванием, но любому потребителю PDF придется относиться к такому файлу иначе, чем к файлу PDF 1.4 или ниже.

...