Python Undo Unicode - PullRequest
       5

Python Undo Unicode

1 голос
/ 25 ноября 2010

Допустим, у меня есть следующие две переменные:

bob1 = u'bob\xf0\xa4\xad\xa2'

bob2 = 'bob\xf0\xa4\xad\xa2'

Как я могу получить значение bob1 равным bob2? То есть как развернуть форматирование в юникоде, но сохранить шестнадцатеричное значение escapped?

Если я сделаю это:

bob1.encode('utf8')
'bob\xc3\xb0\xc2\xa4\xc2\xad\xc2\xa2'

Это не правильно ...

* * 1012 Помощь! * * 1013

1 Ответ

6 голосов
/ 25 ноября 2010

Кодовые точки между U + 0000 и U + 00FF отображаются на одно и то же значение байта в кодировках ISO 8859-1 или Latin 1. 1. 1001 *

>>> u'bob\xf0\xa4\xad\xa2'.encode('latin-1')
'bob\xf0\xa4\xad\xa2'
...