Прежде всего, прежде чем говорить о деталях, вы должны понять, что сканирование выполняется крайне медленно. Если вы просматриваете какой-либо сайт, для любого значимого индексирования в Интернете требуются минуты и, по крайней мере, дни, если вы просматриваете несколько источников (часто недели, месяцы или годы). Обслуживание поиска путем сканирования в реальном времени вообще нецелесообразно.
Что касается деталей, ничто не мешает написать сканер в Javascript. Однако не во встроенном в браузер javascript, по крайней мере, без прокси на стороне сервера из-за политики перекрестного происхождения.