Я пишу программу на Perl для извлечения значений от <td>
и <a href>
до </a>
и, скорее всего, я хочу получить результат после /domain/
, как указано в исходном коде HTML.Мне нужно чаще использовать такую информацию в будущем, поэтому, пожалуйста, помогите мне.
Мой вопрос: где я ошибаюсь и почему?Я прочитал много страниц регулярных выражений, но они совсем не помогли.
Фрагмент из программы Perl
Регулярное выражение 1:
while ($response =~ m/<td><a href=\"\/domain\/(.*?)\/dns">(.*?)/g )
Регулярное выражение 2:
while($response =~ s/((?:href|domain))\=\"([^{].*?)/ig ) {
Исходный код HTML
<td><b>‐</b></td><td><div class="">Google LLC < / div >< / td>< td >< b> ‐< /b >< /td >< /tr >< tr class="data-row " >< td> 5 < /td> < td>< a href= "/domain/rate-limited-proxy-66-249-91-229.google.com/dns "> rate-limited-proxy-66-249-91-229.google.com < / a> < /td>