Определите размер файла перед загрузкой изображения с помощью Scraper wget - PullRequest
0 голосов
/ 30 октября 2019

Я пытаюсь получить размер изображения / видео до того, как мой wget его действительно загрузит. Есть ли способ получить размер и сохранить его в переменной?

Я пытался найти это в Интернете, однако я не смог найти никаких решений.

1 Ответ

0 голосов
/ 30 октября 2019

Используйте параметр --spider, а затем сохраните вывод в текстовый файл:

$ wget --spider https://www.google.com/image.jpg > output.txt
$ wget --spider https://www.google.com/video.mp4 > output.txt

Пример вывода:

Spider mode enabled. Check if remote file exists.
--2016-09-16 14:23:42--  http://www.bbc.co.uk/
Resolving www.bbc.co.uk (www.bbc.co.uk)... 212.58.244.67, 212.58.246.91
Connecting to www.bbc.co.uk (www.bbc.co.uk)|212.58.244.67|:80... connected.
HTTP request sent, awaiting response...
  HTTP/1.1 200 OK
  Server: nginx
  Content-Type: text/html; charset=utf-8
  ...
Length: 171933 (168K) [text/html]  <---------- Right here is the file size
Remote file exists and could contain further links,
but recursion is disabled -- not retrieving.

Затем с помощью awk прочитайте второе слово10-й строки, чтобы получить размер файла:

$ awk 'fileSize==10 {print $2}' output.txt
...