Question

Я хочу регулярно получать хэш удаленной веб-страницы, а затем сравнивать текущий и предыдущий хэш, чтобы узнать, изменилось ли что-либо.

Для этого я использую команду wget для рекурсивного извлечения данных.

Мое требование заключается в том, что мне нужно получать другой хэш только в том случае, если произошли некоторые изменения в содержимом веб-страницы, просматриваемой конечными пользователями в их браузере.

Если я выполню простую команду wget, такую как

wget --recursive --page-requirements --convert-links URL/TO/WEBPAGE

ответ будет содержать метки времени в заголовке, и каждый раз я получу новый хэш.

В cURL Я могу установить опцию, чтобы не получать никаких заголовков в ответ, но я не знаю, как применить это в wget?

Таким образом, вопрос в том, что мне делать, чтобы ответ на команду wget приводил к каким-либо заголовкам?

Gerard H. Pille · Answer 1 · 11 сентября 2018

Сохраните веб-страницу (ы) в файле и используйте эту для вычисления вашего хэша.

wget --recursive --page-requirements --convert-links -O /tmp/wget.txt URL/TO/WEBPAGE
md5sum /tmp/wget.txt

Как заставить команду WGET НЕ выводить временные метки в ответ?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как заставить команду WGET НЕ выводить временные метки в ответ?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы