Существуют ли реализации с открытым исходным кодом Mercator Web Crawler? - PullRequest
1 голос
/ 12 апреля 2011

Марк Наджорк и Аллан Хейдон написали отличную статью о своем Java, масштабируемом и расширяемом веб-сканере под названием Mercator.

Вот некоторые ресурсы по веб-сканеру Mercator:

Кто-нибудь видел какие-либо реализации сканера (желательно java)?

Обновление:
У меня У меня были проблемы со ссылками, Я собираюсь попытаться получить лучшие ссылки для ссылочных статей. но я думаю, что я их исправилТеперь.

Ответы [ 3 ]

2 голосов
/ 12 апреля 2011

Я нашел пару сканеров Java, которые должны быть довольно близки к Mercator:

  • Nutch многопоточный и распространяется.1008 * Heritrix является только многопоточным.

Другие ссылки приветствуются.

1 голос
/ 05 февраля 2012
0 голосов
/ 08 июля 2016

StormCrawler - это SDK с открытым исходным кодом для создания распределенных веб-искателей с малой задержкой и Apache Storm . Проект находится под лицензией Apache v2 и состоит из набора повторно используемых ресурсов и компонентов, написанных в основном на Java.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...