Как работать с шаблонами MediaWiki в Pandoc - PullRequest
0 голосов
/ 29 марта 2020

Я хочу использовать pando c для преобразования страниц из Arch Wiki в файлы PDF. Это mediawiki страницы. В качестве примера, используйте источник для страницы создания пакетов (я сохранил этот источник в файл CreatingPackages.wiki). Многие из этих страниц используют шаблоны в форме:

{{Template name|param1|param2|...}}

Возможно восстановить код для этих шаблонов (который является HTML кодом). Например, шаблон {{AUR|package}} имеет следующее определение:

<span class="plainlinks archwiki-template-pkg">[https://aur.archlinux.org/packages/{{urlencode:{{{1}}}}}/ {{{1}}}]</span><sup><small>AUR</small></sup>

(см. Источник шаблона для шаблона: AUR , в частности, часть в тегах includeonly HTML .)

При необработанном запуске на одной из страниц Arch Wiki возникнут проблемы, поскольку pando c видит шаблоны и не знает, что с ними делать. Например, вот команда преобразования:

pandoc -f mediawiki -t pdf CreatingPackages.wiki > test.pdf

Полученный PDF не так уж и плох, но ясно, что pando c не знает, как обрабатывать шаблоны, что приводит к отсутствию текст и случайное неправильное форматирование.

Как я могу pando c инструктировать, что делать с шаблонами?

...