Question

У меня есть текстовый файл, содержащий строки с последовательностями байтов Unicode. Например, одна строка:

L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book.

В моем выходном файле мне нужно написать строку выше, как показано ниже:

L'Oscar du Meilleur Film est attribué à Green Book.

Как я могу справиться с этим? Спасибо

Tenfrow · Answer 1 · 27 марта 2020

Я думаю, это то, что вы ищете:

s = "L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book."
print s.decode('unicode_escape')

Для записи в файл это будет:

with open('result.txt', 'w') as f:
  f.write("L'Oscar du Meilleur Film est attribu\u00e9 \u00e0 Green Book.".decode('unicode_escape').encode('utf8') + "\n")

Как преобразовать байтовые последовательности Юникода, присутствующие в файле, в соответствующие символы Юникода в python 2.7?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как преобразовать байтовые последовательности Юникода, присутствующие в файле, в соответствующие символы Юникода в python 2.7?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы