Я делаю скрипт на python, используя Scrapy, чтобы собрать данные с сайта, используя аутентификацию.Страница, которую я копирую, действительно мучительна, потому что она в основном сделана с использованием запросов javascript и AJAX.Все тело страницы помещено внутрь <form>
, что позволяет изменять страницу с помощью кнопки submit
.URL не меняется (и это .aspx).
Я успешно сделал, что удалил все данные, которые мне нужны, со страницы 1, затем изменил страницу, нажав на эту кнопку ввода с помощью этого кода:
yield FormRequest.from_response(response,
formname="Form",
clickdata={"class":"PageNext"},
callback=self.after_login)
Метод after_login
очищает данные.Однако мне нужны данные, которые появляются в другом div после нажатия на контейнер с атрибутом onclick
.Мне нужно сделать цикл, чтобы щелкнуть по каждому контейнеру, отобразить данные, очистить их, и сразу после этого я перехожу на следующую страницу и выполняю тот же процесс.
Дело в том, что я могу 'Не могу найти способ сделать процесс, в котором «сценарий» просто щелкает по контейнеру с помощью Selenium (при входе в систему, если нет, я не могу перейти на эту страницу), а затем Scrapy собирает данные, которые после выполнения запроса XHR.
Я провел много исследований в Интернете, но не смог найти какое-либо решение.
Спасибо!