В настоящее время я изменяю скрипт оболочки offline-dokuwiki [1], чтобы получить последнюю документацию для приложения для автоматического встраивания в экземпляры этого приложения.Это работает довольно хорошо, за исключением того, что в его нынешнем виде он захватывает три версии каждой страницы:
- Полная страница, включая верхний и нижний колонтитулы
- Только содержимое без верхнего и нижнего колонтитула
- Необработанный вики-синтаксис
Меня на самом деле интересует только 2. Это связано с основными страницами тегом html <link>
в <head>
, например:
<link rel="alternate" type="text/html" title="Plain HTML"
href="/dokuwiki/doku.php?do=export_xhtml&id=documentation:index" />
и тот же URL, что и основные вики-страницы, только они содержат 'do = export_xhtml' в строке запроса.Есть ли способ указать wget загружать только эти версии или автоматически добавлять '& do = export_xhtml' в конец любых ссылок, по которым он идет?Если это так, это было бы очень полезно.
[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh (автор: samlt)