Я пользуюсь следующей веб-страницей, используя scrapy-splash, http://www.starcitygames.com/buylist/,, к которой мне нужно войти, чтобы получить нужные мне данные.Это работает нормально, но для получения данных мне нужно нажать кнопку дисплея, чтобы я мог очистить эти данные, необходимые мне данные не доступны, пока кнопка не нажата.Я уже получил ответ на этот вопрос, который сказал мне, что я не могу просто нажать кнопку отображения и очистить данные, которые отображаются, и что мне нужно очистить веб-страницу JSON, связанную с этой информацией, но я обеспокоен тем, что очистка JSON вместо этого будет краснойотметьте владельцев сайта, так как большинство людей не открывают страницу данных JSON, и потребуется несколько минут, чтобы найти ее по сравнению с компьютером, который будет намного быстрее.Итак, я предполагаю, что мой вопрос заключается в том, есть ли в любом случае очистка веб-страницы, на которой я щелкаю, и откуда она идет, или у меня нет другого выбора, кроме как очистить страницу JSON?Это то, что я получил до сих пор ... но это не нажатие кнопки.
import scrapy
from ..items import NameItem
class LoginSpider(scrapy.Spider):
name = "LoginSpider"
start_urls = ["http://www.starcitygames.com/buylist/"]
def parse(self, response):
return scrapy.FormRequest.from_response(
response,
formcss='#existing_users form',
formdata={'ex_usr_email': 'abc@example.com', 'ex_usr_pass': 'password'},
callback=self.after_login
)
def after_login(self, response):
item = NameItem()
display_button = response.xpath('//a[contains(., "Display>>")]/@href').get()
yield response.follow(display_button, self.parse)
item["Name"] = response.css("div.bl-result-title::text").get()
return item