Я работаю над проектом, в котором мне нужно извлечь TIFF на страницу из многостраничных PDF-файлов.PDF-файлы содержат только изображения, и на странице есть одно изображение (я думаю, что они были сделаны на каком-то копировальном аппарате / сканере, но не подтвердили это).Затем TIFF используются для создания нескольких других производных версий документа, поэтому чем выше разрешение, тем лучше.
Я нашел два рецепта, оба с полезными аспектами, но ни один из них не идеален.Надеясь, что кто-то может помочь мне настроить один из них или предложить третий вариант.
Рецепт 1 , pdfimages и ImageMagick:
Сначала сделайте:
$ pdfimages $MY_PDF.pdf foo"
Что приводит к нескольким .pbm
файлам (названным foo-000.pbm
, foo-001.pbm
) и т. Д.
Затем для каждого *.pbm
do:
$ convert $each -resize 3200x3200\> -quality 100 $new_name.tif
Pro: Theрезультирующие TIFF - это исправные 3300+ пикселей в длинном измерении (-resize просто служит для нормализации всего)
Con: ориентация страниц потеряна, и они выходят повернутыми в разных направлениях (они следуют логическим схемамтак что, вероятно, это ориентация, в которой они подавались на сканер ??).
Рецепт 2 Imagemagick соло:
convert +adjoin $MY_PDF.pdf pages.tif
Это дает мне TIFFна страницу (pages-0.tif
, pages-1.tif
и т. д.).
Pro: ориентация остается!
Con: длинный размер результирующего файла <800 px, что слишком малобыть полезным, и похоже, что применяется некоторое сжатие. </p>
Как я могу угробить масштабирование IM?возраст потока в PDF, но сохранить ориентацию?Есть ли еще какая-то магия в ImageMagick, которую мне не хватает?Что-то еще целиком?