Python - BeautifulSoup - не английские символы не читаются должным образом - PullRequest
0 голосов
/ 06 июня 2018

Я пытался извлечь данные из HTML-страницы, используя BeautifulSoup, но символы на других языках читаются неправильно.

Код, который я использую:

soup=BeautifulSoup("C:\Myfile.html","html.parser")
htmlText=soup.body.get_text()

Пример ошибки: ß печатается как ß

Мета HTML:

<meta http-equiv="Content-Type" content="text/html; charset=utf-8 ">

Iтакже пытался soup.decode("utf-8")

Использование Python 3.6

Почему это происходит?Пожалуйста, помогите.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...