Я пытаюсь загрузить статическое зеркало вики с помощью wget. Я хочу только последнюю версию каждой статьи (не полная история или различия между версиями). Было бы легко просто загрузить все и удалить ненужные страницы позже, но это заняло бы слишком много времени и привело бы к ненужной нагрузке на сервер.
Есть ряд страниц, которые мне явно не нужны, например:
WhoIsDoingWhat? Действие = дифф и дата = 1184177979
Есть ли способ запретить wget скачивать и рекурсировать по URL, в которых есть 'action = diff'? Или иначе исключить URL, которые соответствуют некоторому регулярному выражению?