Я ищу какой-то инструмент, который может взять HTML-документ и вывести представление файла на основе селектора.
Например:
<div>
Some text
<ul class="foo">
<li>First</li>
<li>Second</li>
<ul>
</div>
и выводить текстовый файл в духе:
div
div #text Some text
div ul.foo li Frist
div ul.foo li Second
Целью этого было бы создание некоторой функции предиката, которая могла бы сравнивать две HTML-страницы и сообщать, в какой степени они совпадают, и явно иметь возможность отдельно сказать, сколько контента или макета является разные.
(Для любопытных, это для фазы QA относительно большого проекта миграции данных)