Страница JavaScript ScrapySplash не будет отображаться - PullRequest
1 голос
/ 10 ноября 2019

Я сам обучаю себя питону и столкнулся с интересной проблемой, которую сам не смог решить, поэтому я прошу вас, гении.

Я пытаюсь сделать эту веб-страницу https://apps.gsccca.org/login.asp в JavaScript с помощью Scrapy-Splash. Файл .html, который я сохранил, не отображается в javascript, а файл .png. Я также хочу, чтобы файл .html отображался.

import base64

import scrapy
from scrapy_splash import SplashRequest

class TestSpider(scrapy.Spider):
    name = "TestSpider 1"

    def start_requests(self):
        url = 'https://apps.gsccca.org/login.asp'
        splash_args = {
                'wait': 0.5,
                'html': 1,
                'png': 1,
                'width': 600,
                'render_all': 1,
        }
        yield SplashRequest(url=url, callback=self.save_page, endpoint='render.json', args=splash_args)

    def save_page(self, response):
        filename = 'html_page.html'
        with open(filename, 'wb') as f:
            f.write(response.body)

        png_bytes = base64.b64decode(response.data['png'])
        filename = 'some_image.png'
        with open(filename, 'wb') as f:
            f.write(png_bytes)

Я ожидаю, что сохраненный файл html_page.html должен быть страницей, отображаемой на JavaScript.

...