Это в основном решение на основе сценария оболочки для Unix или Windows с системой Cygwin.
Чтобы получить интересующую страницу,
wget -N <URI>
Сделайте это один раз из командной строки и получите файл.
Откройте файл в каком-нибудь редакторе и проверьте ваш шаблон интереса.
Затем вы можете использовать grep, sed, awk или даже perl, чтобы отфильтровать интересующие вас вещи.
Затем вы можете записать все это в сценарий оболочки и зациклить его в спящем режиме или подключить к заданию cron.
Для этого вам в основном нужно выучить немного sed, awk , grep . Но это должно быть быстрым для поставленной цели, и то, что вы узнаете, будет пригодно в будущем для других подобных нужд. Вы также можете погрузиться в Perl или Python, но я не буду предлагать начать с нуля, что вам нужно здесь.