Вместо того, чтобы пытаться скопировать страницу, как вы сказали, лучшим решением может быть использование ее RSS-канала - например, в вашем случае: http://drupal.org/node/185969/release/feed
Преимущество состоит в том, что RSS являетсячетко определенный формат: меньше шансов получить любую ненужную информацию в супе HTML.
Чтобы извлечь данные из этого канала XML, вы можете использовать SimpleXML для работы с данными XML "с помощью-hand ", или какая-то библиотека, например SimplePie , которая знает RSS / ATOM.
Затем, в вашем случае, вы должны отслеживать последнее обновление - и каждый раз, когда вы получаетеRSS-канал, проверьте, есть ли обновление, которое было более новым, чем последнее, которое вы видели в прошлый раз.
В XML для вашего модуля Marinelli вы увидите, что каждая запись содержит <pubDate>
тег, соответствующий его дате;например:
<pubDate>Tue, 25 Aug 2009 07:28:26 +0000</pubDate>
Если сегодня самая последняя запись от 2009-08-25, а завтра будет запись от 2010-07-27 ... Ну, это означает, что модуль имеетобновлено; -)