Использование -A / - accept нарушает рекурсивный поиск wget для меня - PullRequest
0 голосов
/ 12 февраля 2020

Я использую GNU wget 1.20.3, построенный на mingw32. Я пытаюсь отразить дерево файлов и загрузить ТОЛЬКО PDF-файлы. Странно, но использование аргумента -A нарушает рекурсию. Команда, которую я ОЖИДАЛ для работы:

wget --mirror -e robots=off -nd -np -A.pdf *target*

Если я УДАЛИТЬ -A.pdf, она успешно извлекает ВСЕ содержимое (включая, конечно, кроме PDF-файлов) из target и subdirs, и создает ожидаемое дерево каталогов в моей локальной системе. Если я ДОБАВЛЮ -A.pdf, чтобы попытаться получить ТОЛЬКО PDF-файлы, он вытягивает все PDF-файлы ТОЛЬКО с уровня 1 и никогда не возвращается ни в какие подкаталоги.

Мне удалось подделать мой путь к решению, потому что -R делает работать, поэтому я в конечном итоге использовал

wget --mirror -l2 -e robots=off -nH -np --cut-dirs=5 -Rhtml,tmp,zip,7z,1,2,3,4,5,6,7,8,9,0 *target*

, который получает все, кроме перечисленных расширений от target и на один уровень подкаталогов ниже.

Я не могу найти любые задокументированные причины для этого. Это ожидаемое поведение?

...