Попытка выполнить этот код для очистки указанных c веб-сайтов / RSS-каналов, указанных здесь ниже, продолжает получать:
Трассировка (последний последний вызов):
Файл "C : \ Users \ Jeanne \ Desktop \ PYPDIT \ pyscape.py ", строка 28, в transcripts = [url_to_transcript (u) для вас в URL]
Файл" C: \ Users \ Jeanne \ Desktop \ PYPDIT \ pyscape.py ", строка 28, в стенограммах = [url_to_transcript (u) для вас в URL]
Файл" C: \ Users \ Jeanne \ Desktop \ PYPDIT \ pyscape.py ", строка 17, в url_to_transcript text = [p.text для p в soup.find (class _ = "itemcontent"). Find_all ('p')]
AttributeError: у объекта 'NoneType' нет атрибута 'find_all'
Пожалуйста, сообщите.
import requests
from bs4 import BeautifulSoup
import pickle
def url_to_transcript(url):
page = requests.get(url).text
soup = BeautifulSoup(page, "lxml")
text = [p.text for p in soup.find(class_="itemcontent").find_all('p')]
print(url)
return text
URL-адреса транскриптов в области
urls = ['http://feeds.nos.nl/nosnieuwstech',
'http://feeds.nos.nl/nosnieuwsalgemeen']
transcripts = [url_to_transcript(u) for u in urls]