Python Unicode горе - PullRequest
       4

Python Unicode горе

0 голосов
/ 22 марта 2011

Как правильно преобразовать '\ xbb' в строку Unicode?Я пробовал следующее и получаю только UnicodeDecodeError:

unicode('\xbb', 'utf-8')

'\xbb'.decode('utf-8')

Ответы [ 3 ]

8 голосов
/ 22 марта 2011

Так как это происходит из Word, это, вероятно, CP1252.

>>> print '\xbb'.decode('cp1252')
»
1 голос
/ 22 марта 2011

Похоже, что в кодировке Latin-1. Вы должны использовать:

Юникод ('\ xbb', 'Latin-1')

0 голосов
/ 22 марта 2011

Не уверен, что вы пытаетесь сделать.Но в Python3 все строки по умолчанию имеют Юникод.В Python2.X вы должны использовать u'my unicode string \xbb' (или двойные, тройные кавычки), чтобы получить строки Unicode.Когда вы хотите напечатать строки в кодировке Unicode, вы должны закодировать их в наборе символов, который поддерживается на устройстве вывода, например.терминал.u'my unicode string \xbb'.endoce('iso-8859-1') например.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...