Я пытаюсь заставить мой веб-скребок пройти несколько ссылок перед тем, как на самом деле очистить сайт, и я не могу найти, как заставить его работать.
Сайт, который я пытаюсь очистить,амазонка.
Допустим, я начинаю с https://www.amazon.com/ (это мой 'start_url').Оказавшись там, я хочу найти что-то в строке поиска Amazon, например, «Ноутбуки», и пройти поиск.
Как это можно сделать?Я могу извлечь данные, если принудительно запустить начальный URL (например, URL для поиска ноутбуков: https://www.amazon.com/s/ref=nb_sb_noss?url=search-alias%3Daps&field-keywords=Laptop), но я не могу получить этот URL при запуске с домашней страницы Amazon.