Поэтому я попытался написать простую функцию для очистки текста и суммировать его:
def getTextWaPo(url):
page = urllib2.urlopen(url).read().decode('utf8')
soup = BeautifulSoup(page, "lxml")
text = ' '.join(map(lambda p: p.text, soup.find_all('article')))
return text.encode('ascii', errors='replace').replace("?"," ")
, но для этого куска кода я получаю эту ошибку:
File "Autosummarizer.py", line 12, in getTextWaPo
return text.encode('ascii', errors='replace').replace("?"," ")
TypeError: a bytes-like object is required, not 'str'
line 12 ==> text = getTextWaPo(articleURL)
что должноЯ делаю?