Какой самый лучший парсер для получения docbook от word, rtf, ecc - PullRequest
0 голосов
/ 31 августа 2011

Мне нужно знать, как лучше всего решить мою проблему.

Я хочу создать редактор Docbook, который получает файл слов (или любые другие форматы расширенного текста) и позволяет изменять содержимое / стиль для создания книги.

По сути, с помощью этого вопроса я хочу изучить, как лучше всего достичь этого результата.

Лучше ли

-> upload the file
-> parse it to docbook 
-> transform it to xhtml 
-> modify with wysiwyg editor
-> save changes to docbook

или

-> upload the file
-> transform it to xhtml syntax
-> modify the xhtml with a wysiwyg editor
-> convert xhtml to docbook

Пожалуйста, расскажите о решении с помощью некоторых инструментов / библиотек / программ, которые могут помочь мне в этом (если это возможно).

1 Ответ

1 голос
/ 31 августа 2011

После проверки DocBook XSL позволяет преобразовывать (в частности):

  • DocBook XML в Word XML
  • Word XML до DocBook XML
  • DocBook XML до XHTML

Думаю, у вас есть общее решение.XSLT может обрабатываться множеством языков программирования.

Что касается ваших двух процессов, я понимаю, что разница в том, что во втором вы пытаетесь обнаружить только те изменения в XHTML, которые отражают их вDocBook XML.Вероятно, будет проще конвертировать его полностью с использованием XSL.

Я думаю, что вы должны сказать нам, каков контекст создаваемого вами приложения, и тогда мы сможем узнать внутренние ограничения и лучше откалибровать наши ответы.

Редактировать : Вы можете вдохновить себя или даже принять это как решение: Oxygen XML Editor.См. http://www.oxygenxml.com/docbook_editor.html

Этот редактор может редактировать DocBook в WYSIWYG и импортировать / экспортировать его многими способами.

Существует более простая версия Author, которая должна делать все это.

...