Я бы посоветовал вам записать ссылки на файл вместе с отметкой даты / времени последней обработки.Когда вы пишете ссылки на файл, вам нужно убедиться, что вы не пишете одну и ту же ссылку дважды.Вы также захотите поставить отметку даты / времени после завершения обработки.
Когда у вас есть этот список, при запуске сценария вы читаете весь список и начинаете обработку ссылок, которые еще не были обработаны.через X дней (или по вашим критериям).
Шаги:
- Загрузить файл ссылок
- Очистить ссылки с карты сайта, сравнить с существующими ссылками из файла, написатьлюбые новые ссылки на файл
- Найдите первую ссылку, которая не была обработана в течение X дней
Обработайте эту ссылку, затем напишите отметку даты / времени рядом со ссылкой, например,
http://www.google.com,1/25/2019 12:00PM
- Вернитесь к шагу 3
Теперь каждый раз, когда вы убиваете прогон, процесс запускается с того места, где вы остановились.
ПРИМЕЧАНИЕ. Простовыписать дату может быть достаточно.Это зависит только от того, как часто вы хотите обновить свой список (ежечасно и т. Д.) Или хотите ли вы так много деталей.