Я пытался извлечь данные из HTML-страницы, используя BeautifulSoup, но символы на других языках читаются неправильно.
Код, который я использую:
soup=BeautifulSoup("C:\Myfile.html","html.parser")
htmlText=soup.body.get_text()
Пример ошибки: ß печатается как ß
Мета HTML:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8 ">
Iтакже пытался soup.decode("utf-8")
Использование Python 3.6
Почему это происходит?Пожалуйста, помогите.