Можно ли указать тип содержимого файла для загрузки с помощью Wget? - PullRequest
4 голосов
/ 17 июля 2011

Я хочу использовать wget для загрузки файлов, связанных с главной страницы сайта, но я хочу только загружать текстовые / html файлы. Можно ли ограничить wget текстовыми / html-файлами в зависимости от типа содержимого mime?

Ответы [ 2 ]

1 голос
/ 17 июля 2011

Я не думаю, что они реализовали это еще. Как это все еще там список ошибок.

http://bugs.debian.org/cgi-bin/bugreport.cgi?bug=21148

Возможно, вам придется сделать все по расширению файла

0 голосов
/ 14 ноября 2018

Wget2 имеет эту функцию.

--filter-mime-type    Specify a list of mime types to be saved or ignored`

### `--filter-mime-type=list`

Specify a comma-separated list of MIME types that will be downloaded.  Elements of list may contain wildcards.
If a MIME type starts with the character '!' it won't be downloaded, this is useful when trying to download
something with exceptions. For example, download everything except images:

  wget2 -r https://<site>/<document> --filter-mime-type=*,\!image/*

It is also useful to download files that are compatible with an application of your system. For instance,
download every file that is compatible with LibreOffice Writer from a website using the recursive mode:

  wget2 -r https://<site>/<document> --filter-mime-type=$(sed -r '/^MimeType=/!d;s/^MimeType=//;s/;/,/g' /usr/share/applications/libreoffice-writer.desktop)

Wget2 не был выпущен на сегодняшний день, но скоро будет.В нестабильной версии Debian уже есть альфа-версия.

Для получения дополнительной информации посмотрите https://gitlab.com/gnuwget/wget2.Вы можете оставлять вопросы / комментарии напрямую на bug-wget@gnu.org.

...