pQuery - это прагматичный порт jQuery JavaScript-фреймворка для Perl, который можно использовать для очистки экрана.
pQuery весьма чувствителен к искаженному HTML.Рассмотрим следующий пример:
use pQuery;
my $html_malformed = "<html><head><title>foo</title></head><body>bar</body></html>>";
my $page = pQuery($html_malformed);
my $title = $page->find("title");
print "The title is: ", $title->html, "\n";
pQuery не найдет тег заголовка в приведенном выше примере из-за двойного «>>
» в искаженном HTML.
Чтобы сделать мой pQueryоснованные на приложениях, более терпимые к искаженному HTML, мне нужно предварительно обработать HTML, очистив его перед передачей в pQuery.
Начиная с приведенного выше фрагмента кода, какой самый надежный способ чистого Perl очистить HTML для его анализа: в pQuery?