Краткий ответ:
Да.
Длинный ответ:
Существует два основных способа добавления дополнительных страниц в очередь сканирования.
Предварительно определенная структура:
Псевдо-URL используются для перехода по ссылкам, которые соответствуют определенной структуре. Веб-сайты обычно используют некоторую структуризацию в используемых ими URL-адресах. Например:
https://github.com
использует структуру:
https://github.com/{username}/{repository}
Так что, если вы хотите очистить все хранилища для пользователя apifytech
, вы можете использовать псевдо-URL, например:
https://github.com/apifytech/[.+]
Дополнительную информацию о псевдо-URL можно найти в руководстве для Apify SDK .
Динамическое добавление URL во время выполнения
Если вам нужно динамически добавлять дополнительные ссылки в очередь сканирования во время выполнения, есть несколько вариантов.
При использовании Apify SDK вы всегда можете использовать либо функцию requestQueue.addRequest()
, либо функцию utils.enqueueLinks()
.
При использовании Apify Web Scraper вы можете динамически добавлять больше страниц, используя context.enqueueRequest()
.