Ошибка при отображении сайта Javascript с использованием Python - PullRequest
0 голосов
/ 06 мая 2019

Я пытаюсь очистить тяжелый веб-сайт Javascript.

# import HTMLSession from requests_html
from requests_html import HTMLSession
import logging
import time

# Logging warnings to avoid error messages
logging.captureWarnings(True)

# create an HTML Session object
session = HTMLSession()

url = 'https://duckduckgo.com/'

# Use the object above to connect to needed webpage
resp = session.get(url,verify=False)

# Run JavaScript code on webpage
resp.html.render()

Однако, в зависимости от веб-сайта, я получаю одну из следующих 2 ошибок, попробуйте этот код на

  1. RuntimeError: Невозможно использовать HTMLSession в существующем цикле событий.Вместо этого используйте AsyncHTMLSession.

  2. ConnectionError: HTTPSConnectionPool (host = 'duckduckgo.com', port = 443): превышено максимальное количество попыток с URL: / (вызвано NewConnectionError (': не удалось установитьновое соединение: [Errno 11001] getaddrinfo fail ',))

Я не могу разрешить ни одно из них.Вы можете помочь.

...