Вы можете указать интервал выборки (время между двумя последовательными обходами) для каждой записи в вашем начальном файле следующим образом:
http://daily.com \t nutch.fetchInterval=86400
http://montly.com \t nutch.fetchInterval=2592000
Если вы используете AdaptiveFetchSchedule
, указанные выше записи просто устанавливают начальный интервал ипосле каждого повторного сканирования в зависимости от того, изменяется страница или нет, этот интервал будет увеличиваться или уменьшаться.В этом случае, если вам всегда нужен фиксированный интервал, вы можете использовать nutch.fetchInterval.fixed
вместо nutch.fetchInterval
в вышеприведенных строках.