Сравните две веб-страницы на основе их DOM - PullRequest
3 голосов
/ 01 июня 2011

Мне интересно, есть ли библиотека, которая позволяет вам делать что-то вроде http://tool.motoricerca.info/similarity-analyzer.phtml В результатах перечисляется что-то, называемое HTML-отпечатком, которое дает процентное значение вероятности структурного сходства двух страниц.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...