Мне нужно преобразовать HTML-документы (сгенерированные из DocBook XML-документов) в язык разметки Wiki, в частности в язык разметки PM Wiki .Цель состоит в том, чтобы включить руководства по работе с приложениями компании в нашу недавно созданную вики.Это означает, что у меня на самом деле есть два варианта:
- Преобразование HTML (сгенерированных из DocBook XML) в вики
- Преобразование XML Docbook непосредственно в вики
Поскольку HTML-коды генерируются конвертером DocBook в HTML, способ определения тегов в документах HTML не сильно отличается, только содержимое документов.
Я ищу решение, которое могло бы бытьреализовано быстро сам.Мне придется выполнять это преобразование один раз, а затем каждый раз, когда создаются новые версии руководств по работе с приложениями.
Решения, о которых я думал до сих пор:
- Преобразование HTML ввики со скриптом Perl или PHP, основанным на регулярных выражениях.
- Конвертируйте Docbook XML прямо в вики.Поскольку это XML, я мог бы использовать Java для разбора XML.Риск здесь заключается в том, что я не знаком с форматом XML DocBooks (как и с HTML), так что это займет некоторое время для изучения.
Какой подход вы бы выбрали для этой работы?
Обновление:
Я только что попробовал расширение PMWiki под названием ConvertHTML .Он не работал должным образом, потому что он не конвертирует теги HTML (например, не конвертируется, как осталось в вики), как говорится в его документации:
Разметка PmWiki не поддерживает весь HTMLразметка, поэтому 100% конверсия невозможна.Тем не менее, PmWiki может заменять текст по мере его редактирования или сохранения.ConvertHTML реализует относительно полный набор правил для преобразования HTML-тегов в вики-разметку.