Существуют ли модули CPAN, которые помогут мне разобрать канал RSS или ATOM в Perl? - PullRequest
8 голосов
/ 27 декабря 2008

Мне нужен код на Perl для запроса и анализа ATOM и RSS-каналов. Есть ли для этого модуль (-и) CPAN?

Ответы [ 4 ]

16 голосов
/ 27 декабря 2008

Практически каждый раз, когда вы спрашиваете «Как я могу сделать X в Perl?», Ответом будет поиск CPAN Search , чтобы найти модуль, который это делает.

Для загрузки из Интернета вам может помочь семейство модулей LWP . Чтобы разобрать документы, попробуйте что-нибудь с Feed , RSS или Atom в имени.

Однако спустя четыре года я рекомендую Mojolicious , который имеет собственный модуль пользовательского агента и очень мощную поддержку синтаксического анализа DOM и различных способов извлечения частей документа. В зависимости от того, что вы хотите, вам, вероятно, больше не нужен специальный модуль подачи.

9 голосов
/ 27 декабря 2008

XML :: FeedPP это хорошо ...

4 голосов
/ 27 декабря 2008

Обе XML :: RSS и XML :: Atom существуют. Будьте осторожны - XML ​​:: Atom, похоже, активно не поддерживается и, как сообщается, содержит ошибки. Но основ должно быть достаточно, чтобы вы начали.

Для получения каналов LWP :: Simple - хороший выбор.

0 голосов
/ 23 июня 2009

Я обнаружил, что XML :: Feed намного лучше справляется с ошибками, которые вы получите , если вы пытаетесь проанализировать произвольные каналы, которые Вы не контролируете поколение.

...