Мне интересно знать, возможно ли сканировать все страницы и ссылки на веб-сайте с любой глубиной, даже если после нескольких ссылок изменяется верхний URL-адрес? Вот пример:
Главный URL: www.topURL.com
имеет 3 ссылки: www.topURL.com/link1, www.topURL.com/link2 и www.topURL.com/link3
Затем, если мы нажмем на www.topURL.com/link1, мы перейдем на страницу, которая сама имеет
2 ссылки на него: www.topURL.com/link4 и www.topURL.com/link5
но если мы нажмем на www.topURL.com/link4, мы перейдем на страницу со следующими двумя ссылками: www.anotherURL.com/link1 и www.thirdURL.com/link1
.
Может ли scrapy или любой гусеничный / паук питона начинаться с www.topURL.com, а затем переходить по ссылкам и заканчиваться на www.thirdURL.com/link1?
Есть ли предел того, насколько глубоко он может зайти?
Есть ли пример кода, чтобы показать мне, как это сделать?
Спасибо за помощь.