Расшифровка utf8 буквального python - PullRequest
0 голосов
/ 26 марта 2020

Я пытаюсь декодировать строки в списке строк, например, 'caf\\xc3\\xab' что я хочу, чтобы это было 'café'.

Я пытался кое-что, но столкнулся с проблемами.

когда я делаю:

for i in range(len(words):
     words[i] = words[i].decode("utf8")

Мне все еще нужно преобразовать в байтовый тип, но как мне это сделать,

также, когда я делаю это таким образом, мне нужно удалить двойную обратную косую черту чтобы это работало

b'caf\\xc3\\xab'.decode("utf8")

1 Ответ

1 голос
/ 26 марта 2020

Предположим, у вас есть следующая строка:

bef = 'caf\\xc3\\xab'

Чтобы преобразовать в 'café', вы можете сделать следующее:

aft = bef.encode().decode('unicode-escape').encode('latin1').decode('utf-8')

Тогда print(aft) должно показать 'café «

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...