Я пытаюсь использовать XPath
для извлечения некоторых HTML-тегов и данных, и для этого мне нужно использовать XML::LibXML
модуль.
Я пытался установить его из оболочки CPAN, но он не устанавливается.
Я следовал инструкциям с сайта CPAN об установке, что нам нужно установить оболочки libxml2
, iconv
и zlib
перед установкой XML::LibXML
, и это не сработало.
Кроме того, если есть какой-либо другой более простой модуль, который выполняет мою задачу, пожалуйста, дайте мне знать.
Задача под рукой:
Я ищу определенный тег <dd>
на html-странице, который является действительно большим (около 5000 - 10000) тегами <dd>
и <dt>
. Итак, я пишу скрипт, который соответствует содержимому в теге <dd>
и извлекает содержимое в соответствующем (следующем) теге <dt>
.
Хотел бы я быть немного яснее. Любая помощь с благодарностью.