Есть ли способ найти все веб-страницы с определенными классами CSS или идентификаторами?Поисковая система для разметки? - PullRequest
1 голос
/ 03 июня 2011

Я пытаюсь найти сайты с внедренной платформой комментирования Disqus (см. Пост на avc.com для справки).Все комментарии Disqus содержатся внутри div с идентификатором "disqus_thread".Я пытался найти слова, которые появляются в интерфейсе комментариев Disqus, такие как «Обновление в реальном времени» и «Подписаться по электронной почте», но, похоже, Google не индексирует эти слова.движок для разметки или простой способ быстро поцарапать множество сайтов под конкретную разметку?Спасибо.

1 Ответ

0 голосов
/ 03 июня 2011

Я сейчас создаю инструмент, способный на это.Он основан на Селене , который вы можете использовать для своей цели.Но это потребовало бы некоторых усилий по разработке.

Но в настоящее время я не знаю о поисковой системе, способной на это.

...