Я хочу использовать pando c для преобразования страниц из Arch Wiki в файлы PDF. Это mediawiki
страницы. В качестве примера, используйте источник для страницы создания пакетов (я сохранил этот источник в файл CreatingPackages.wiki
). Многие из этих страниц используют шаблоны в форме:
{{Template name|param1|param2|...}}
Возможно восстановить код для этих шаблонов (который является HTML кодом). Например, шаблон {{AUR|package}}
имеет следующее определение:
<span class="plainlinks archwiki-template-pkg">[https://aur.archlinux.org/packages/{{urlencode:{{{1}}}}}/ {{{1}}}]</span><sup><small>AUR</small></sup>
(см. Источник шаблона для шаблона: AUR , в частности, часть в тегах includeonly
HTML .)
При необработанном запуске на одной из страниц Arch Wiki возникнут проблемы, поскольку pando c видит шаблоны и не знает, что с ними делать. Например, вот команда преобразования:
pandoc -f mediawiki -t pdf CreatingPackages.wiki > test.pdf
Полученный PDF не так уж и плох, но ясно, что pando c не знает, как обрабатывать шаблоны, что приводит к отсутствию текст и случайное неправильное форматирование.
Как я могу pando c инструктировать, что делать с шаблонами?