Я слежу за учебником и следующим фрагментом кода:
import urllib.request as url
def getTextWaPo(URL):
page = url.urlopen(URL).read().decode('utf8')
soup = BeautifulSoup(page, 'lxml')
mytext = ' '.join(map(lambda p: p.text, soup.find_all('article')))
return mytext.encode('ascii', errors='replace').replace("?", " ")
возвращает:
TypeError: a bytes-like object is required, not 'str'
Тем не менее, в документации я вижу, что кодирование - это строковый метод.Так зачем мне байтоподобный объект?Как убрать специальные символы в тексте, если это не так?
Я оглянулся, но ответы, которые я нашел, мне не помогли, или я по крайней мере не помогаюполучите это.