Python декодировать с таблицей перевода - PullRequest
0 голосов
/ 10 декабря 2018

У меня есть текстовый файл, который зашифрован в неясном «mik-bulgarian». Я пытаюсь преобразовать его в utf-8.До сих пор я понял, что должен прочитать файл в байтах и ​​каким-то образом перевести его с таблицей перевода.Вот некоторые фрагменты строк, которые я пытаюсь преобразовать

без декодирования -> ИМЯ Ј °.Ў¤ «®ў¤Ёў

HEX -> ИМЯ \ xa3 \ xb0.\ x8f \ xab \ xae \ xa2 \ xa4 \ xa8 \ xa2 \ r \ n

cadFile = open(filename,"rb")
filetext = cadFile.read()

#filetest = filetext.translate(mikxtbl)

print(filetext)


 mikxtbl = { \
...
        0x80: "Cyrillic capital letter A (U+0410)",
        0x81: "Cyrillic capital letter BE (U+0411)",
        0x82: "Cyrillic capital letter VE (U+0412)",
        0x83: "Cyrillic capital letter GHE (U+0413)",
        0x84: "Cyrillic capital letter DE (U+0414)",
        0x85: "Cyrillic capital letter IE (U+0415)",
        0x86: "Cyrillic capital letter ZHE (U+0416)",
        0x87: "Cyrillic capital letter ZE (U+0417)",
...
}

1 Ответ

0 голосов
/ 10 декабря 2018

Предполагая, что вы хотите знать, как перевести вашу декодированную строку в utf-8:

tr = { 0x80: "\u0410",
       0x81: "\u0411",
       # etcetera ...
     }
"\x80\x81".translate(tr)
# result: 'АБ'
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...