У меня была практика очистки пакета reports-html под python 3.6.Я пробовал соответствующие веб-сайты, но только один, Стихи.ру, https://www.poetryfoundation.org/poems/browse#page=1&sort_by=recently_added&topics=20, возвращает неверную страницу.Я продемонстрирую это подробно.
Вот исходный код, код, который просто импортирует запросы-html и возвращает стихи, который обернут в :
из запросов_html импорт HTMLSession
class Scrapy:
def __init__(self, session):
self.session = session
def request_content(self, url):
page = self.session.get(url)
results = page.html.find('div.c-feature')
a = True
if __name__ == '__main__':
session = HTMLSession()
scrapy = Scrapy(session)
url = 'https://www.poetryfoundation.org/poems/browse#page=1&sort_by=recently_added&topics=20'
scrapy.request_content(url=url)
независимо от того, каким параметром я изменяю параметр в URL, он просто вернет одну неверную страницу
Спасибо за ваше время