Я экспериментирую с системой для сканирования писем и преобразования отсканированных растровых изображений в PDF с целью получения высокого разрешения и небольшого размера файла PDF.
Я создаю прототипы с помощью сканера, GIMP для обработки растровых изображений и ImageMagick для преобразования растровых изображений в PDF.
Мой процесс выглядит следующим образом:
Сканирование в цвете 3x8bit, 600 DPI,
Сжатый LZW файл в цвете TIFF
размер около 8 Мб.
Использование GIMP для преобразования растрового изображения в индексированное
изображение с типичной таблицей цветов из 4
до 8 цветов. Это делает изображение лучше сжимаемым.
Используйте ImageMagick для преобразования
LZW-сжатый индексированный TIFF-файл PDF,
около 500K на страницу.
Теперь, чтобы сделать изображение еще лучше сжимаемым, я могу сделать растровое изображение более удобным для сжатия. Прежде чем экспериментировать, я хотел бы узнать, как PS / PDF хранит растровые изображения.
Являются ли растровые изображения в PS / PDF кодируемыми по длине? Затем я получу сжатие, удалив отдельные пиксели из растровых строк.
У вас есть идеи для дальнейшей оптимизации?
Знаете ли вы ссылки на формат хранения растровых изображений в PS / PDF?