Я пытаюсь правильно декодировать эту очищенную строку, но я не знаю, в каком коде c строка закодирована, когда она очищается:
это строка:
s_tag = BeautifulSoup('<b>mặt trong, phía trong, phần trong, bên trong</b>')
однако, когда он получает строку таким образом, print(s_tag.string)
я получаю как вывод -> lá»n trong ra ngoà i
, как вы можете видеть, некоторые символы были преобразованы. utf-encoding is utf-8
и язык вьетнамский
Мне сложно понять, что делать, потому что я не знаю, где искать
любая помощь будет отличной