Правильная расшифровка строки из тега bs4 - PullRequest
0 голосов
/ 18 июня 2020

Я пытаюсь правильно декодировать эту очищенную строку, но я не знаю, в каком коде c строка закодирована, когда она очищается:

это строка:

s_tag = BeautifulSoup('<b>mặt trong, phía trong, phần trong, bên trong</b>')

однако, когда он получает строку таким образом, print(s_tag.string) я получаю как вывод -> lá»n trong ra ngoà i, как вы можете видеть, некоторые символы были преобразованы. utf-encoding is utf-8 и язык вьетнамский

Мне сложно понять, что делать, потому что я не знаю, где искать

любая помощь будет отличной

...