Мне нужно разобрать некоторые данные с веб-страниц. Как извлечь текст между тегами, используя HTML :: Parser?
Рассмотрим следующий пример кода:
#!/usr/bin/perl
use strict;
use warnings;
use HTML::Parser;
use Data::Dumper;
my $find_title = HTML::Parser->new(
api_version => 3,
start_h => [
sub {
my ($tag, $attr) = @_;
print Dumper \@_;
},
'tag'
],
);
my $html = join '',
"<html><head><title>Extract me!</title></head><body>",
(map { qq(<a href="http://$_.com">$_</a>) } qw/foo bar baz/),
"</body></html>";
$find_title->report_tags('title');
$find_title->parse($html);
Как это исправить, чтобы я мог извлечь заголовок? Это только извлекает тег.