У меня под HTML-страницей есть два anchor
тега в качестве входных данных для моего perl-скрипта:
<a href="link.html"> TITLE </a> <a href="link.html"> SUB TITLE </a>
Я хочу извлечь только заголовок, т. Е. Мне нужен текст только из первого тега привязки <a>
, а второй тег привязки <a>
текст следует игнорировать. И это мне нужно сделать только с помощью Perl Regex.
Я пробовал ниже Regex, но он не работает должным образом:
<a[^>]*[^>]*>(?!.*a>.*)a>
Весь сценарий выглядит так:
#!/usr/bin/perl
use strict;
use warnings;
my $str = '<a href="link.html"> TITLE </a> <a href="link.html"> SUB TITLE </a>';
my $res = $str =~ m/<a[^>]*[^>]*>(?!.*a>.*)a>/;
print $res;
Исполнение:
prakash@prak-pc:~$ perl regtest.pl
prakash@prak-pc:~$