Как удалить HTML-теги с идентификаторами в Perl? - PullRequest
0 голосов
/ 15 декабря 2010

знает ли кто-нибудь здесь о том, как вырезать теги html с помощью Perl при использовании XML :: Simple output?

Вот код, который у меня есть;

#!/usr/bin/perl
use XML::Simple;
$xml = new XML::Simple;
$data = $xml->XMLin('library.xml', ForceArray => 1, KeyAttr => {},);

foreach my $library (@{$data->{library}})
{
  foreach my $shelf (@{$library->{shelf}})
  {
    print $xml->XMLout($shelf, RootName => "book", NoSort => 1);
  }
}

Этот код выведет что-то вроде этого;

<library>
  <book shelf="12345">Book Title Here</book>
</library>

Как убрать теги и просто сохранить заголовок. Возможно, есть лучший способ сделать это, пожалуйста, дайте мне знать.

Любая помощь будет принята с благодарностью :-) Спасибо.

1 Ответ

1 голос
/ 10 января 2011

если вы ничего не нашли в XML :: Simple для ваших целей, почему бы просто не удалить теги?

    local $_ = $xml->XMLout($shelf, RootName => "book", NoSort => 1);
    s#<.+?>#\n#sg;
    s#\s*\n+\s*#\n#sg;
    print;
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...