Я пытаюсь очистить тяжелый веб-сайт Javascript.
# import HTMLSession from requests_html
from requests_html import HTMLSession
import logging
import time
# Logging warnings to avoid error messages
logging.captureWarnings(True)
# create an HTML Session object
session = HTMLSession()
url = 'https://duckduckgo.com/'
# Use the object above to connect to needed webpage
resp = session.get(url,verify=False)
# Run JavaScript code on webpage
resp.html.render()
Однако, в зависимости от веб-сайта, я получаю одну из следующих 2 ошибок, попробуйте этот код на
RuntimeError: Невозможно использовать HTMLSession в существующем цикле событий.Вместо этого используйте AsyncHTMLSession.
ConnectionError: HTTPSConnectionPool (host = 'duckduckgo.com', port = 443): превышено максимальное количество попыток с URL: / (вызвано NewConnectionError (': не удалось установитьновое соединение: [Errno 11001] getaddrinfo fail ',))
Я не могу разрешить ни одно из них.Вы можете помочь.