Найти теги на веб-сайте HTML - PullRequest
       13

Найти теги на веб-сайте HTML

0 голосов
/ 08 сентября 2010

Я использую Perl.

У меня есть тег, например: "XYZ_PKM_HTML" Я хотел бы иметь возможность предоставить базовый URL, например: www.example.com и получитьHTML-страница (не обязательно главная страница, это просто), где появляется этот тег.Является ли это возможным?любая идея?(или уже сделанные модули, посмотрел на cpan, были некоторые интересные вещи, но не устанавливаемые)

Спасибо,

Ответы [ 3 ]

4 голосов
/ 08 сентября 2010

MJD имеет расширенный пример написания веб-паука в Perl высшего порядка . Это раздел 4.7. См. стр. 187 в главе 4 .

Конечно, вы также можете попробовать модуль WWW :: SimpleRobot , о котором он упоминает.

1 голос
/ 08 сентября 2010

Вы, похоже, хотите внедрить сканер веб-сайтов и поисковик. Вы обычно делаете первое с WWW::Mechanize, а второе с HTML::Twig

0 голосов
/ 25 февраля 2011

Попробуйте Web-Scraper в Perl. Информация о модуле Web-Scraper . С ним легко работать, и вы можете искать определенные теги или элементы и получать данные из него.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...