Я пытаюсь почистить новостной сайт для данных, и теперь мне нужен текст в тегах p.
Я много гуглил, но все решения либо возвращают "Нет", либо выдают эту ошибку:
Traceback (most recent call last):
File "E:/Python/News Uploader to Google Driver/venv/Scripts/main.py", line 41, in <module>
contents = parse(text)
File "E:/Python/News Uploader to Google Driver/venv/Scripts/main.py", line 28, in parse
article = soup.find("div", {"class": "content_text row description"}).findAll('p')
AttributeError: 'NoneType' object has no attribute 'findAll
def parse(url):
html = requests.get(url)
#array_of_paragraphs = [""]
soup = BeautifulSoup(html.content, 'html5lib')
text = []
text = soup.find("div", {"class": "content_text row description"}).findAll('p')
for t in text:
text = ''.join(element.findAll(text=True))
return text
URL-адрес в настоящее время такой: https://gadgets.ndtv.com/mobiles/news/samsung-galaxy-a-series-56-percent-q2-smartphone-sales-share-counterpoint-2112319
Вы можете использовать его в целях тестирования
Помимо сообщения «Нет» или ошибкина консоли ничего не отображается