Как конвертировать PDF в изображение без текста - PullRequest
4 голосов
/ 09 сентября 2011

Я хотел бы знать, возможно ли преобразовать PDF-файл и изображение без шрифтов.Моя цель - иметь только изображение без текста?

И если да, могу ли я сделать это с помощью ImageMagick / GhostScript?

Вот пример

Изображение окончательное http://crocodoc_public.s3.amazonaws.com/8b8aa154-45e3-41f9-a465-628e1b2e955d/images/page-001.png

и оригинальный PDF http://crocodoc.com/demo/efwpa (стр. 2). Мы видим, что текст накладывается на изображение, я хочу сделать то же самое.

Ответы [ 3 ]

1 голос
/ 10 сентября 2011

Так что, если я вас правильно понял, вам нужно удалить текст из вашего PDF (не шрифты ), и вы захотите сделать это программно.Я подозреваю, что вы уже знаете, что это возможно только в том случае, если текст помещен в какой-то отдельный слой в ваших файлах PDF.Для этого вы можете попробовать использовать iText .Осторожно, это будет означать, что вам придется потратить несколько дней на изучение того, как использовать эту библиотеку.

0 голосов
/ 19 декабря 2013

Я тоже в поисках чего-то подобного. Играя с imagemagick, я попробовал эту команду и получил неожиданные результаты.

convert -input.pdf -blur 0x0 output.jpg

Это удаляет текстовые слои из PDF-файлов, которые я пробовал.

Я не могу гарантировать, что это сработает для вас и если это правильный путь для достижения, но вы можете попробовать.

0 голосов
/ 09 сентября 2011

Вы можете сделать это с помощью Adobe Acrobat. Выделите текст с помощью инструмента подправки и удалите его. Я не думаю, что вы можете сделать это с Ghostscript. Вы можете отредактировать PDF вручную ( qpdf подсказки).

...