Поиск в источнике HTML с GOOGLE? - PullRequest
52 голосов
/ 24 ноября 2010

У меня есть несколько сайтов, и я не могу вспомнить, где я написал несколько строк кода. Поскольку мои страницы индексируются Google, я хотел бы знать, предлагает ли Google средство для поиска по самому исходному коду HTML / разметке, вместо , просто позволяя выполнять поиск в визуальной, визуализированной части страница?

Спасибо

Ответы [ 4 ]

33 голосов
/ 07 ноября 2013

Существует новая поисковая система с именем NerdyData , которая позволяет выполнять поиск по исходному коду HTML / CSS / JS

Они проиндексировали более 160 миллионов общедоступных доменов, и я нашел данные полезными.

24 голосов
/ 18 февраля 2015

В своих путешествиях я встречал следующие ресурсы (некоторые уже упоминались выше):

HTML-поисковые системы, ориентированные на повышение цен

Я также хотел бы добавить следующее:

Огромный, архив данных сканирования веб-сайта

Как мы можем проанализировать эти данные сканирования?

Чтобы узнать, как начать анализ некоторых из этих массивных данных, взгляните на Большие данные/ Каркасные структуры типа редукции .

Google перечисляет некоторые идеи по использованию проекта Spark Apache для анализа дампов общего сканирования .Чтобы понять формат (ы) файлов, используемые Common Crawl , обратитесь к следующему:

Статья, Accessing-Common-Crawl-Dataset-on-S3, обрисовывает в общих чертах доступ к 250 ТБ + дамп Common Crawl недорогим способом без передачи этой загрузки данных вне сети Amazon AWS / S3.Конечно, это предполагает, что вы собираетесь использовать некоторую комбинацию AWS / EC2 / S3 и т. Д. Для анализа данных сканирования.

Наконец, Патрик Дурусау поддерживает некоторые интересные страницы блога, связанные с общим сканированием .

Лично я нахожу эту тему интригующей, предлагаю получить эти данные сканирования, пока ГОРЯЧИЙ!; -)

6 голосов
/ 26 апреля 2016

Вы можете попробовать PublicWWW для поиска по источнику / разметке. Позволяет найти любой HTML, JavaScript, CSS и простой текст в исходном коде веб-страницы на 167 миллионов веб-сайтов.

С PublicWWW вы можете:

  • Поиск соответствующих веб-сайтов с помощью уникальных HTML-кодов, которыми они делятся, т.е. ID виджетов и издателей.

  • Идентифицируйте сайты, используя определенные изображения или значки.

  • Узнайте, кто еще использует вашу тему.
  • Идентифицируйте сайты, упоминающие вас.
  • Найдите филиалы вашего конкурента.
  • Укажите сайты, где ваши конкуренты лично сотрудничают или взаимодействуют.
  • Ссылки на использование библиотеки или платформы.
  • Найти примеры кода в сети.
  • Выясните, кто какие виджеты JS использует на своих сайтах.
  • ...

Конечно, вы можете найти не только свои веб-сайты, которые используют некоторый фрагмент кода / разметки.

2 голосов
/ 20 октября 2014

Google не может выполнить поиск по вашему коду с сайта. Можно использовать http://nerdydata.com/ Это лучшая поисковая система кода, которую я использовал! Я думаю, что вы получите свой точный код с этого сайта.

...