Викитекст в xml - PullRequest
       300

Викитекст в xml

0 голосов
/ 03 июня 2011

Есть ли способ преобразовать wikitext данные в простой XML в приложении Java?

Пример ввода:

  == A section ==
  this is some text...           

{{MyTemplate
|attr1=some value
|attr2=some other value
      ...

Пример вывода:

<section title='A section'>this is some text...</section>
<ValueDescription attr1='some value' attr2='some other value' ...>

Это кажется тривиальной задачей, но я не смог найти библиотеку для этого на Java.

Mulone

Ответы [ 2 ]

1 голос
/ 04 июня 2011

XML имеет древовидную структуру, по большей части вики-текст.Напримерэто полностью допустимо:

== A section {{DoubleEqual{{echo|Sign}}}}

Сам синтаксис шаблона является иерархическим, и MediaWiki сама преобразует его в XML (вы можете использовать Special: ExpandTemplates , чтобы проверить его), но остальныеСинтаксис слишком свободен для XML или других формальных описаний, таких как контекстно-свободная грамматика.

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * "* 1009" * * * * * * * * * * * * "*".не ожидайте, что это скоро закончится.

0 голосов
/ 19 июня 2011

http://sweble.org/wiki/Wikitext-parser/ у них есть правильно выполненный синтаксический анализатор, но я думаю, что для AST еще нет вывода XML.

@ Tgr: Синтаксически это не совсем совместимо с деревом, но семантически оноесть.

И да, обработка Викитекста - огромный беспорядок.

...