Как заставить команду WGET НЕ выводить временные метки в ответ? - PullRequest
0 голосов
/ 11 сентября 2018

Я хочу регулярно получать хэш удаленной веб-страницы, а затем сравнивать текущий и предыдущий хэш, чтобы узнать, изменилось ли что-либо.

Для этого я использую команду wget для рекурсивного извлечения данных.

Мое требование заключается в том, что мне нужно получать другой хэш только в том случае, если произошли некоторые изменения в содержимом веб-страницы, просматриваемой конечными пользователями в их браузере.

Если я выполню простую команду wget, такую ​​как

wget --recursive --page-requirements --convert-links URL/TO/WEBPAGE

ответ будет содержать метки времени в заголовке, и каждый раз я получу новый хэш.

В cURL Я могу установить опцию, чтобы не получать никаких заголовков в ответ, но я не знаю, как применить это в wget?

Таким образом, вопрос в том, что мне делать, чтобы ответ на команду wget приводил к каким-либо заголовкам?

1 Ответ

0 голосов
/ 11 сентября 2018

Сохраните веб-страницу (ы) в файле и используйте эту для вычисления вашего хэша.

wget --recursive --page-requirements --convert-links -O /tmp/wget.txt URL/TO/WEBPAGE
md5sum /tmp/wget.txt
...