Я пытаюсь перебрать некоторые страницы.Различные страницы помечены или 10, или 20, или 30 и т. Д. Для веб-сайта.т.е.
/Restaurant_Review
- это первая страница
/Restaurant_Review-or10
- это вторая страница
/Restaurant_Review-or20
3-я страница и т. д.
Проблема в том, чтоЯ перенаправлен с этих сайтов на обычный URL (1-й), если -or- версия не существует.В настоящее время я перебираю диапазон в цикле for и динамически меняю значение -or-.
def parse(self,response):
l = range(100)
reviewRange = l[10::10]
for x in reviewRange:
yield((url+"-or"+str(x)), callback=self.parse_page)
def parse_page(self,response):
#do something
#How can I from here tell the for loop to stop
if(oldurl == response.url):
return break
#this doesnt work
Проблема в том, что мне нужно выполнить запрос, даже если страница не существует,и это не масштабируется.Я пытался сравнить URL-адреса, но все еще не понимал, как я могу вернуть из функции parse_page () что-то, что сообщит функции parse () об остановке.