Я удаляю сегменты после того, как они проиндексированы, тогда как Nutch получит время последней загрузки страниц при повторном сканировании?Нужно ли хранить их, чтобы ускорить повторное сканирование?
Время последней выборки поддерживается crawldb, а не сегментами.Сегменты полезны только с точки зрения индексации и поиска.Хранение в любом из данных НЕ повлияет на скорость сканирования.