У меня проблемы с печатью текста с этой страницы, поскольку BeautifulSoup не выбирает теги класса span или class.Я хотел бы вытащить текст из Motley Fool, а затем проанализировать предложение.
https://www.fool.com/earnings/call-transcripts/2019/04/26/exxon-mobil-corp-xom-q1-2019-earnings-conference-c.aspx
До тех пор, пока он иногда вытягивает текст, парсинг предложений работает, однако, красивый суп лишь иногда вытягивает текст.
from textblob import TextBlob
from html.parser import HTMLParser
import re
def news():
# the target we want to open
url = dataframe_url
#open with GET method
resp=requests.get(url)
#http_respone 200 means OK status
if resp.status_code==200:
soup = BeautifulSoup(resp.text,"html.parser")
#l = soup.find("span",attrs={'class':"article-content"})
l = soup.find("section",attrs={'class':"usmf-new article-body"})
#print ('\n-----\n'.join(tokenizer.tokenize(l.text)))
textlist.extend(tokenizer.tokenize(l.text))
else:
print("Error")