Как преобразовать байтовые последовательности Юникода, присутствующие в файле, в соответствующие символы Юникода в python 2.7? - PullRequest
0 голосов
/ 27 марта 2020

У меня есть текстовый файл, содержащий строки с последовательностями байтов Unicode. Например, одна строка:

L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book.

В моем выходном файле мне нужно написать строку выше, как показано ниже:

L'Oscar du Meilleur Film est attribué à Green Book.

Как я могу справиться с этим? Спасибо

1 Ответ

0 голосов
/ 27 марта 2020

Я думаю, это то, что вы ищете:

s = "L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book."
print s.decode('unicode_escape')

Для записи в файл это будет:

with open('result.txt', 'w') as f:
  f.write("L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book.".decode('unicode_escape').encode('utf8') + "\n")
...