Оптимизация таблицы квантования JPEG для изображений текстовых документов в градациях серого - PullRequest
2 голосов
/ 02 августа 2011

Обработка сигналов: Сжатие изображений:

Я хочу хранить полноцветные текстовые изображения в формате JPEG или TIFF-JPEG.Эти изображения содержат текстовые документы с некоторой цветной графикой.Даже при очень высоких уровнях качества JPEG в тексте по-прежнему много артефактов и ухудшений.

У меня есть полный контроль над параметрами кодирования JPEG, включая коэффициенты подвыборки и матрицу квантования.Мой вопрос:

  • Можно ли оптимизировать эти параметры для текстовых документов?(Помимо уровня качества)
  • Могу ли я применить различные настройки параметров для разных частей изображения?
  • Поможет ли это, если я вручную урежу (квантову) коэффициенты для разных частей изображенияперед кодированием?

(позже приложу образец изображения, потому что не могу получить доступ к imgur в офисе.)

Ответы [ 3 ]

2 голосов
/ 20 февраля 2012

Рассматривали ли вы использование PDF в качестве вывода?С помощью PDF вы можете выполнять динамический порог для черно-белого текста, чтобы сжать его как 1-bpp CCITT G4.Вы также можете захватить цветные объекты на странице и сжать их с помощью FLATE или JPEG.Страница PDF может быть составной из этих двух типов объектов.Вы получите максимально возможное качество и намного лучшее сжатие.

1 голос
/ 21 июня 2012

Я второе предложение BitBank об использовании PDF для сжатия различного контента различными способами - я вижу это иногда называемое «MRC» - смешанный растровый контент. Много литературы.

Вы не говорите, являются ли ваши изображения синтетическими или отсканированными. Для синтетических изображений мой личный опыт показывает, что даже LZW (в формате TIFF) может сделать замечательную работу, особенно если вы готовы выполнить некоторую предварительную обработку (с потерями) для гомогенизации значений выборки. То есть, если вы можете квантовать достаточно похожих значений, чтобы они стали равными.

Но если ваши изображения сканируются, очень трудно предварительно обработать их до достаточно чистого изображения, чтобы LZW или любое другое сжатие без потерь могло найти сцепление. Таким образом, остается JPEG, о котором я бы сказал почти противоположность ruslik, что потери JPEG очень легко регулируемы как в глобальном масштабе, так и в частотной области. Конечно, можно настроить таблицы квантования для выборочного улучшения качества текста. Я не эксперт, но отправной точкой, которую я случайно вспомнил, является работа Джордано Бруно Беретта и Ко. в лабораториях HP, например Метод выбора таблиц квантования JPEG для приложений с низкой пропускной способностью

1 голос
/ 02 августа 2011

Стандартный JPEG с потерями, и вы ничего не можете с этим поделать. И потерянная информация должна остаться незамеченной на естественном (гладком) изображении.

Я хочу сказать, что для искусственного изображения вы должны использовать кодек без потерь. Не JPEG без потерь, но что-то, что поддерживает хотя бы RLE. Например, PNG или JPEG-LS будут иметь намного лучшие результаты на таких изображениях.

...