Как я могу извлечь и отформатировать HTML, найденный в теге div, используя Perl? - PullRequest
2 голосов
/ 21 декабря 2009

Примечание:

Вопрос:

  • Использование Perl с LWP , для следующего HTML, как поиск для литеральной строки независимо между начальным тегом и конечным тегом div , а затем получить весь текст между вышеупомянутым начальным и конечным тегом, в то время как придерживается для форматирования текстовых тегов

    <div id="foo" class="blah">
    <tt>
    test
    <br>test 
    <br>whatever
    <br>test
    </div>
    

Для печати в STDOUT:

test
test
whatever
test 

Ответы [ 2 ]

4 голосов
/ 21 декабря 2009
$node->find_by_attribute(attribute, value) and $node->as_text() 

http://lwp.interglacial.com/ch09_03.htm

2 голосов
/ 22 декабря 2009
my @elms = $tree->look_down(
  _tag => "div",
  sub { $_[0]->as_text =~ /whatever/ },
);

for my $elm (@elms) {
  print $elm->as_trimmed_text;
}
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...