Преобразование XML или HTML в вики-разметку - какой подход вы бы выбрали? - PullRequest
2 голосов
/ 29 октября 2009

Мне нужно преобразовать HTML-документы (сгенерированные из DocBook XML-документов) в язык разметки Wiki, в частности в язык разметки PM Wiki .Цель состоит в том, чтобы включить руководства по работе с приложениями компании в нашу недавно созданную вики.Это означает, что у меня на самом деле есть два варианта:

  1. Преобразование HTML (сгенерированных из DocBook XML) в вики
  2. Преобразование XML Docbook непосредственно в вики

Поскольку HTML-коды генерируются конвертером DocBook в HTML, способ определения тегов в документах HTML не сильно отличается, только содержимое документов.

Я ищу решение, которое могло бы бытьреализовано быстро сам.Мне придется выполнять это преобразование один раз, а затем каждый раз, когда создаются новые версии руководств по работе с приложениями.

Решения, о которых я думал до сих пор:

  1. Преобразование HTML ввики со скриптом Perl или PHP, основанным на регулярных выражениях.
  2. Конвертируйте Docbook XML прямо в вики.Поскольку это XML, я мог бы использовать Java для разбора XML.Риск здесь заключается в том, что я не знаком с форматом XML DocBooks (как и с HTML), так что это займет некоторое время для изучения.

Какой подход вы бы выбрали для этой работы?

Обновление:

Я только что попробовал расширение PMWiki под названием ConvertHTML .Он не работал должным образом, потому что он не конвертирует теги HTML (например, не конвертируется, как осталось в вики), как говорится в его документации:

Разметка PmWiki не поддерживает весь HTMLразметка, поэтому 100% конверсия невозможна.Тем не менее, PmWiki может заменять текст по мере его редактирования или сохранения.ConvertHTML реализует относительно полный набор правил для преобразования HTML-тегов в вики-разметку.

Ответы [ 3 ]

4 голосов
/ 29 октября 2009

Это может быть полезно, хотя оно конвертирует из DocBook в MediaWiki, а не из PM Wiki.

Существуют модули Perl, которые могут конвертировать HTML в различные диалекты вики: HTML :: WikiConverter . Так что, если вы можете перевести вашу DocBook в HTML, это тоже может сработать.

1 голос
/ 29 октября 2009

Я использовал Digester для генерации объектов Java из простого XML-файла и изменения его для своих нужд через Java. Это очень простой в использовании инструмент. Может быть, вы хотите попробовать. Работал на меня ..

0 голосов
/ 20 марта 2012

Попробуйте HTML2Mediawiki

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...