Question

Есть ли там какой-нибудь модуль, который может дать мне ссылки на все страницы сайта?

Зачем мне это нужно: я хочу сканировать некоторые сайты и искать в них теги, поиск только на главной странице недостаточен

Спасибо,

Drew Stephens · Answer 1 · 06 сентября 2010

Классический способ сканирования сайтов в Perl - WWW :: Mechanize , который имеет метод links, который возвращает список всех ссылок со страницы. Вы можете получить страницу, получить с нее ссылки, а затем использовать метод follow_link () или get () для получения связанной страницы.

brian d foy · Answer 2 · 06 сентября 2010

HTML :: SimpleLinkExtor немного проще, чем HTML :: LinkExtor .Вы можете проверить мою нерешительную попытку использовать мой инструмент для чтения веб-страниц , в котором есть часть кода, который вам, вероятно, понадобится.

James Kastrantas · Answer 3 · 06 сентября 2010

Другой способ сделать это - использовать HTML :: TreeBuilder для анализа HTML-кода со страницы.Он возвращает дерево объектов, которое вы можете использовать для получения всех ссылок со страницы, и может сделать гораздо больше, например найти ссылку на основе заданного вами шаблона регулярного выражения.Ознакомьтесь с документацией HTML :: Element, чтобы узнать больше.

Чтобы найти все ссылки на странице:

use HTML::TreeBuilder;
use LWP::Simple;

my $url  = 'http://www.example.com/';
my $html = HTML::TreeBuilder->new_from_content(get($url));

my @links = $html->look_down('_tag'   => 'a');

Я считаю, что LWP :: Simple и HTML :: TreeBuilder включеныв Ubuntu, а также.

Модуль Perl, чтобы получить все страницы сайта?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Модуль Perl, чтобы получить все страницы сайта?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 4 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов