Преобразование Пандока из Mediawiki в GFM - PullRequest
2 голосов
/ 21 марта 2019

Столкнувшись с проблемами при попытке конвертировать файл MediaWiki с помощью Pandoc в GitHub Flavored Markdown, у нас есть несколько шаблонов, как показано ниже:

{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
| Some text....
|}

Сценарий завершился ошибкой:

Error at "source" (line 156, column 19):
unexpected "c"
expecting lf new-line, "!", "<" or "|"
{|cellspacing="0" cellpadding = "10" style="border-style:solid; border-color:black; border-width:1px;" width="100%"
                  ^
  • Инструмент Pandoc 2.0.1.1
  • Вход XML-файл, экспортированный из MediaWiki 1.21.2
  • Выход Уценкаfile
pandoc --from=mediawiki --to=gfm C:\Users\xxx\AppData\Local\Temp/pandoc5c93ace7d42b7

Любые предложения, спасибо за вашу поддержку.

1 Ответ

1 голос
/ 21 марта 2019

Pandoc не может прочитать экспортированный XML, но только фактическую разметку MediaWiki. Разметка экспортируется как часть XML, но должна извлекаться через процессор XML, если кто-то хочет передать ее в pandoc.

Найдите элемент (ы) /mediawiki/page[ns=0]/revision/text (XPath).

...