Я пытаюсь декодировать строку, закодированную в shift-jis, например:
string.decode('shift-jis').encode('utf-8')
чтобы просмотреть его в моей программе.
Когда я сталкиваюсь с 2 символами shift-jis, в гексах "0x87 0x54" и "0x87 0x55", я получаю эту ошибку:
UnicodeDecodeError: 'shift_jis' codec can't decode bytes in position 12-13: illegal multibyte sequence
Но я уверен, что это действительные символы shift-jis: http://www.rikai.com/library/kanjitables/kanji_codes.sjis.shtml
Я также заметил, что эти символы отображаются в виде черных ящиков в моем текстовом редакторе shift-jis, что означает, что они не распознаются. Так что в этих двух символах есть что-то особенное, что заставило мой редактор и Python-декодер выйти из строя. Помощь
(извините, я не смог опубликовать пример строки, потому что, когда эти символы присутствуют, он не добавляется в буфер обмена с этого момента, а также автоматически конвертируется в юникод. Хотя я опубликовал шестнадцатеричные значения для них. )