Узнайте, был ли URL изменен с момента последнего сканирования Nutch2 - PullRequest
0 голосов
/ 17 июня 2020

Я использую Nutch2.4 для сканирования с Mon go и Solr, как описано здесь: https://lobster1234.github.io/2017/08/14/search-with-nutch-mongodb-solr/

Сканирование работает нормально, mon go и Solr получает данные. Однако я хотел бы получить список URL-адресов в последнем сканировании, которые изменились с момента последнего посещения Nutch. Я не могу найти ни одного метода для достижения этой цели и буду признателен за любую помощь.

...