Ищете способ соскрести URL со страницы и вывести его в текстовый файл - PullRequest
0 голосов
/ 22 октября 2010

Я ищу способ вычистить URL-адреса с веб-страницы и вывести их в текстовый файл. Например, если страница содержит несколько http://example.com/article, я хочу получить оба этих URL-адреса и вывести их в текстовый файл.

Ответы [ 2 ]

5 голосов
/ 22 октября 2010

Взгляните на WWW :: Mechanize .

Пример кода:

use strict;
use warnings;
use 5.010;

use WWW::Mechanize;

my $mech = WWW::Mechanize->new();
$mech->get('http://example.com/example');
foreach my $link ($mech->find_all_links()) {
    say $link->url_abs();
}
3 голосов
/ 22 октября 2010

Использование HTML :: SimpleLinkExtor :

use strict;
use warnings;

use HTML::SimpleLinkExtor;

my $extor = HTML::SimpleLinkExtor->new();
$extor->parse_url('http://example.com/article');
my @links = $extor->absolute_links();
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...