aks 07 сентября 2010 1

сканировать веб-сайт для данных с частыми интервалами

Ответы [ 2 ]

Zhang18 / 07 сентября 2010

Используйте sleep для управления периодом ожидания и используйте WWW::Mechanize для извлечения данных:

use strict;
use WWW::Mechanize;

my $mech = WWW::Mechanize->new();
my $url = "http://www.nytimes.com";  # a sample webpage
while (1) {
    $mech->get($url);
    print $mech->content(format => 'text');  # read docs for WWW::Mechanize for advanced content processing
    sleep 300;  # wait for 5 minutes
}

РЕДАКТИРОВАТЬ: улучшен процесс поиска содержимого образца.

...