вывод декодирования base64 имеет символы не ascii - PullRequest
0 голосов
/ 01 февраля 2020

У меня проблемы с правильным декодированием данных base64. Он правильно декодирует сообщение, но также включает в себя тонну символов, отличных от ascii, которые затем мне тоже нужно почистить, поэтому мне было интересно, правильно ли я его декодировал, или мне нужно будет создать скрипт для очистки после декодирования текста , Ниже приведен код python и часть вывода, который я собираюсь проиллюстрировать. Спасибо!

message= base64.b64decode(base64_message).decode(errors='ignore')

enter image description here

1 Ответ

1 голос
/ 01 февраля 2020

Вы явно пытаетесь декодировать документ Word, который по определению не является простым текстом. Убедитесь, что вы пытаетесь декодировать текст. В противном случае сохраните результат декодирования в файл (file.docx?) И откройте его в соответствующем приложении.


После ответа на вопрос в комментариях вам не нужно получать текст из base64. оставь все как есть и запиши в файл. Вместо

base64.b64decode(base64_message).decode(errors='ignore')

используйте просто

base64.b64decode(base64_message)

и все будет хорошо:

>>> a = base64.b64encode('\x01\x02\x04')
>>> a
'AQIE'
>>> base64.b64decode(a)
'\x01\x02\x04'
...