Как настроить Nutch на сканирование только обновленных страниц на сайте? - PullRequest
0 голосов
/ 04 декабря 2018

Например, если мой веб-сайт содержит всего 10 URL-адресов, при первом сканировании я сканирую все URL-адреса, а при повторном сканировании должен сканироваться только те URL-адреса / страницы, на которых есть изменения, и не сканировать другие страницы.используйте карты сайта, чтобы определить измененные страницы и сканировать их.

...