Вывод PCL из документа Word с использованием Python - PullRequest
0 голосов
/ 23 января 2012

Я создаю веб-приложение, которое будет включать в себя функциональность, которая принимает документы MS Word (и, возможно, ввод из веб-редактора форматированного текста), подставляет значения в заполнители полей формы в этих документах и ​​генерирует документ PCL в качестве вывода..

Я занимаюсь разработкой на python и django для Windows, но все это решение необходимо будет развернуть на веб-хосте (пока не выбрано), что на практике означает, что решение должно будет работать налинукс.

Я открыт для решений только для Linux, если это единственный способ.Я открыт для решений, которые включают общение с сервером, написанным на другом языке.Я могу написать C ++ или Java, если это необходимо.Окончательный результат должен быть в формате PCL.

Мой вопрос: Какова хорошая цепочка инструментов для генерации PCL из текстовых документов с использованием python ?

Я подумываю использовать какой-то интерфейс для openoffice, чтобы открывать текстовые документы, выполнять подстановки и отправлять вывод в какой-то драйвер принтера. У кого-нибудь есть опыт с этим?Какие библиотеки вы бы порекомендовали?

Варианты взаимодействия, которые я определил, включают следующее;любые другие предложения будут приветствоваться:

Второй подход заключается в использовании чего-то вроде paradocx (https://bitbucket.org/yougov/paradocx/wiki/Home) для открытия файлов слов.замены, использующие это в python, затем как-то взаимодействуют с чем-то, что может выводить PCL Опять же, любой опыт или комментарии по этому подходу будут оценены.

Я буду очень признателен за любые комментарии к инструментам и наборам инструментов, а также идеи или рецепты, которые у вас могут быть.

Этот вопрос охватывает аналогичные вопросы, но не совпадает с: Как создать файл PCL из MS Word

Ответы [ 2 ]

2 голосов
/ 23 января 2012

Ghostscript может читать PS (Postscript) или PDF и создавать PCL. Вы можете использовать библиотеки Python или просто подпроцесс ....

0 голосов
/ 30 января 2012

ОК, поэтому мое окончательное решение заключалось в создании веб-сервиса Java для выполнения моего транскодирования.

  • Docx4j предоставляет класс org.docx4j.convert.out.pdf.viaXSLFO.Conversion, который подключается к apache FOP для преобразования Docx в PDF; которые можно легко взломать для преобразования в PCL (поскольку FOP выводит PCL)
  • Spark - это легкая веб-платформа Java, которая позволила мне обернуть мой транскодер в веб-службу
  • Поскольку я также манипулирую документом, мне нужно иметь некоторые метаданные, поэтому идеальная вещь - это многочастная форма. Я декодирую это, используя Apache Fileupload

Почти во всех случаях мне приходилось обновляться до версий разработки библиотек, чтобы заставить это работать.

На стороне питона я использую:

  • requests для связи с веб-сервисом
  • poster для подготовки многочастного запроса
...