Blacklining PDF-файлов - PullRequest
       7

Blacklining PDF-файлов

2 голосов
/ 22 февраля 2011

Я пытаюсь найти способ создания заштрихованных pdf-файлов (т.е. выделены различия между двумя версиями файла, аналогично функции «Сравнение и объединение документов» в MS Word).

Iдо сих пор пробовал несколько различных подходов, с неоптимальными результатами: 1) Использование функции «Сравнить документы» в Adobe Acrobat.Основная проблема с этим подходом заключалась в том, что некоторый текст интерпретировался как изображение (почему? Текст можно копировать / вставлять ...), что приводило к очень грубым различиям.

2) Преобразование PDF-файлов в Wordдокументы и используя функцию сравнения Word.Проблема этого подхода заключается в том, что преобразование из .pdf -> .doc ненадежно (некоторый текст отсутствует в файле .doc), а также некоторые ложноположительные различия (символы форматирования и тому подобное, используемое Acrobat для создания документа Word).

3) Часть программного обеспечения, называемая Workshare (http://www.workshare.com/products/). Это .. плохо изуродовано .. документы находятся в непригодном для использования состоянии.

Мы генерируем файлы .pdf программно, используя библиотеку ReportLab, работающую ввеб-фреймворк Django. Следовательно, создание черных pdf-файлов программно возможно, и, вероятно, даст лучшие результаты, но это будет более трудоемкой задачей.

Есть предложения?

(Действительно? stackoverflow не позволяет мне использовать тег с именем 'blacklining'? Действительно ??!)

...