Использование wget для загрузки страниц докувики только в обычном формате xhtml - PullRequest
1 голос
/ 25 мая 2011

В настоящее время я изменяю скрипт оболочки offline-dokuwiki [1], чтобы получить последнюю документацию для приложения для автоматического встраивания в экземпляры этого приложения.Это работает довольно хорошо, за исключением того, что в его нынешнем виде он захватывает три версии каждой страницы:

  1. Полная страница, включая верхний и нижний колонтитулы
  2. Только содержимое без верхнего и нижнего колонтитула
  3. Необработанный вики-синтаксис

Меня на самом деле интересует только 2. Это связано с основными страницами тегом html <link> в <head>, например:

<link rel="alternate" type="text/html" title="Plain HTML" 
href="/dokuwiki/doku.php?do=export_xhtml&amp;id=documentation:index" /> 

и тот же URL, что и основные вики-страницы, только они содержат 'do = export_xhtml' в строке запроса.Есть ли способ указать wget загружать только эти версии или автоматически добавлять '& do = export_xhtml' в конец любых ссылок, по которым он идет?Если это так, это было бы очень полезно.

[1] http://www.dokuwiki.org/tips:offline-dokuwiki.sh (автор: samlt)

1 Ответ

2 голосов
/ 28 мая 2011

DokuWiki также принимает параметр do в качестве заголовка HTTP.Вы можете запустить wget с параметром --header "X-DokuWiki-Do: export_xhtml"

...