Вопрос мониторинга веб-страницы - PullRequest
7 голосов
/ 13 июня 2011

Существует ряд различных веб-сайтов, которые позволяют отслеживать определенные веб-страницы на предмет любых изменений, например watchthatpage.com или page2rss.com

Мне интересно, как эти сайты работают, то естькак они определяют, обновляется ли какая-либо веб-страница.Они просто копируют весь текст со страницы, сохраняют его в памяти и сравнивают позже с содержимым страницы сайта?Или, может быть, они ищут какие-то конкретные элементы HTML и сравнивают их значения?

Пожалуйста, помогите мне найти ответ.

Ответы [ 3 ]

2 голосов
/ 13 июня 2011

Как это работает: http://www.watchthatpage.com/information.jsp

0 голосов
/ 13 июня 2011

Есть два способа, которыми это можно сделать прямо у меня над головой.

Во-первых, вытащить HTML-код и выполнить простую строку.

Второй способ - выполнить запрос HEAD. См. Раздел 9.4 здесь

0 голосов
/ 13 июня 2011

Я подозреваю, что они хранят все содержимое, и каждый раз, когда они проверяют, они сравнивают. Если отличается, отправьте уведомление, в противном случае не.

...