Конвертировать из шестнадцатеричной строки в юникод - PullRequest
2 голосов
/ 13 октября 2009

Как я могу преобразовать строку 'dead' в строку Unicode u'\xde\xad'?

Делаем это:

from binascii import unhexlify
out = ''.join(x for x in [unhexlify('de'), unhexlify('ad')])

создает <type 'str'> строку '\xde\xad'

Попытка использовать Unicode.join () следующим образом:

from binascii import unhexlify
out = ''.join(x for x in [u'', unhexlify('de'), unhexlify('ad')])

приводит к ошибке:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xde in position 0: ordinal not in range(128)

Ответы [ 2 ]

5 голосов
/ 13 октября 2009

Unicode разработан для совместимости с Latin-1, вы можете использовать его и просто декодировать строку байта:

In [2]: unhexlify('dead').decode('latin1')
Out[2]: u'\xde\xad'
1 голос
/ 13 октября 2009

См. этот юникод Python с практическими рекомендациями и используйте что-то похожее на:

unicode('\x80abc', errors='replace')

или

unicode('\x80abc', errors='ignore')
...