Если вы используете промежуточное программное обеспечение-заставку, и все ответы-заставки поступают в обычный объект-ответ, доступ к которому вы можете получить через response.css и response.xpath.В зависимости от того, какую конечную точку вы используете, вы можете выполнять JavaScript и другие вещи.
Если вам нужно перемещаться по странице и другим вещам, вам нужно написать сценарий LUA для выполнения с соответствующей конечной точкой.Что касается анализа вывода, он автоматически переходит в объект ответа.
Избавьтесь от open_in_browser Я не совсем уверен, что вы делаете, но если все, что вы хотите сделать, это проанализировать страницу, вы можете сделать так, кактак что
body = response.css('body').extract_first()
links = response.css('a::attr(href)').extract()
Если бы вы могли уточнить ваш вопрос, большинство людей не хотят просматривать ссылки, чтобы попытаться угадать, с чем у вас проблемы.
Обновление для уточненного вопроса:
Звучит так, как будто вам может понадобиться оболочка Scrapy с Splash. Это позволит вам поэкспериментировать с селекторами:
scrapy shell 'http://localhost:8050/render.html?url=http://page.html&timeout=10&wait=0.5'
Чтобы получить доступ к Splash в экземпляре браузера, просто перейдите наhttp://0.0.0.0:8050/ вы вводите URL там.Я не уверен в методе из учебника, но именно так вы можете взаимодействовать с сеансом Splash.