Конвертировать документ Word в XSL-FO - PullRequest
9 голосов
/ 17 сентября 2010

Я использую Microsoft Word 2007. Я хотел бы преобразовать документ Word в XSL-FO. В сети есть некоторые подсказки, но только для RenderX. Есть ли такой инструмент для Apache FOP?

Ответы [ 5 ]

8 голосов
/ 17 сентября 2010

RenderX имеет набор свободно доступных таблиц стилей XSLT для преобразования документов Microsoft WordprocessingML в XSL FO (XSLFO)

Эти общедоступные таблицы стилей можно использовать для преобразования документов Microsoft WordprocessingML в XSL FO (XSLFO)

Вам не нужно использовать сгенерированный XSL-FO с RenderX. Вы можете запускать их для создания вывода XSL-FO и рендеринга в любом движке XSL-FO (включая Apache FOP).

Antennahouse также имеет таблицу стилей WordMLToFO , но она не бесплатна ($ 200)

2 голосов
/ 18 сентября 2010

docx4j использует FOP для создания PDF-файлов из docx.

XSLT находится в здесь , но вы можете начать с этого веб-приложения, которое может генерировать XSLFO из загруженного документа .

Он использует функции расширения для выполнения тяжелых задач, поэтому он действительно работает только как часть docx4j, но он легко доступен и лицензирован ASLv2.

Да, у RenderX есть свои http://www.renderx.com/tools/word2fo.html, но лицензия ограничительна, и версия 20070227 предназначена для Word 2003 WordML (может быть, есть более новая?

1 голос
/ 25 июля 2012

Word может сделать это самостоятельно. Вот инструкции Microsoft: http://msdn.microsoft.com/en-us/library/office/aa537167%28v=office.11%29.aspx#officewordwordmltoxsl-fo_creatinganxslfodocumentfromword

Вот ссылка на скачивание необходимого XSL - Word2FO.xsl: http://www.microsoft.com/en-us/download/details.aspx?id=16876

0 голосов
/ 16 августа 2018

Некоторое время назад я создал инструмент отчетности, который изменяет RenderX XSLT, который первоначально преобразует wordML 2003 в XSLFO, чтобы выполнить wordML 2003 -> XSLT, который позже объединяется с данными XML, чтобы в конечном итоге генерировать XSLFO с шаблоном + данные.Вам нужно было создать свой шаблон в слове, затем импортировать сгенерированный XSLT в веб-приложение и запустить запрос, который генерирует XML и объединяет его с предоставленным вами шаблоном.

https://github.com/juanmf/neatReports

Документация

https://github.com/juanmf/neatReports/blob/master/doc/HowToReport.pdf

0 голосов
/ 19 сентября 2010

Если вам нужна поддержка DOCX (Word 2007), вам нужно распаковать файл и объединить отдельные ресурсы, чтобы использовать таблицы стилей.И это половина проблемы, потому что в прошлый раз, когда я проверял, в таблицах стилей были серьезные ограничения, такие как обработка стилей / тем, продолжение разделов и так далее.Если вы можете себе это позволить, вам может понадобиться коммерческий DOCX to PDF engine .Важно помнить, что проход через XSL-FO на самом деле неосуществим, поскольку XSL-FO не обеспечивает поддержку вкладок, плотного обтекания текста вокруг изображений или других функций Word.

...