В зависимости от того, как дана ссылка и как вы определяете заголовок, вам нужен тот или иной подход.
В точном сценарии, который вы представили, получите URL с URI::Find
, HTML::LinkExtractor
и т. Д., А затем my $title=URI->new($link)->path()
обеспечит заголовок и ссылка.
Но если заголовок веб-сайта представляет собой связанный текст, такой как <a href="https://stackoverflow.com/badges"> badged</a>
, то Как извлечь URL и текст ссылки из HTML в Perl? даст вам ответ.
Если заголовок закодирован в самой ссылке, а ссылка - это сам текст ссылки, как вы определяете заголовок?
- Хотите ли вы последний бит URI перед любым запросом? Что происходит с запросами, заданными как URL-пути?
- Требуется ли раздел между хостом и запросом?
- Хотите проанализировать источник ссылки и получить тег заголовка, если таковой имеется?
Как всегда, переход от тривиальной первой реализации ко всем угловым случаям - непростая задача; -)