Как конвертировать из формата ISO-8859-1 в UTF-8, а затем в шестнадцатеричный формат строки Python - PullRequest
0 голосов
/ 04 октября 2018

Как мне преобразовать символ формата UTF-8 '戧' в шестнадцатеричное значение и сохранить его в виде строки "0xe6 0x88 0xa7".

with open(fromFilename,  encoding = "ISO-8859-1") as f:
    while True:
        c = f.read(1)
        if not c:
            print ("End of file")
            break
        print ("Read a character: %c", c)
        newC = repr(c.encode('utf-8'))
        print ("Read a decode character: %c", newC)
        newString = newString + newC

Это мой код.Пожалуйста, дайте мне знать, что не так.

1 Ответ

0 голосов
/ 04 октября 2018

Это работает для меня в Python 3.7

a = '戧'
encoded_bytes = a.encode(encoding='utf-8')
print(' '.join([hex(b) for b in encoded_bytes]))

>>> 0xe6 0x88 0xa7
...