Когда вы вводите источник html в объект BeautifulSoup, вы хотите передать его как строку. Когда вы используете url.read()
, у вас уже есть строка в виде строки, поэтому нет необходимости преобразовывать ее в строку с .content
, так как это уже строка, следовательно, ошибка, у * нет атрибута content
в str
. Просто исключите эту строку.
n=0
link = coverpage_news[n]['href']
title = coverpage_news[n].get_text()
article_content = url.read()
soup_article = BeautifulSoup(article_content, 'html5lib')