Ошибка! блафайл не в кодировке UTF-8. Сохранение отключено - PullRequest
0 голосов
/ 09 апреля 2020

Итак, я пытаюсь написать файл gzip, на самом деле из net, но для упрощения я написал очень базовый c тест.

import gzip
LINES = [b'I am a test line' for _ in range(100_000)]
f = gzip.open('./test.text.gz', 'wb')
for line in LINES:
    f.write(line)
f.close()

Он работает отлично, и я в Jupyter видно, что он создал файл test.txt.gz в списке каталогов. Поэтому я нажимаю на него, ожидая, что целый ряд мусорных символов будет указывать на двоичный файл, как вы могли бы видеть в Блокноте.
Однако вместо этого я получаю это ...

Error!  test.text.gz is not UTF-8 encoded.
Saving disabled.
See console for more details

Что заставляет меня задуматься Боже мой, ошибка кодирования, что-то не так с моей кодировкой, моим сохранением, могу ли я сохранить байты? Я использую правильные процедуры? А затем потратьте 5 часов, пробуя все комбинации кода и модулей.

1 Ответ

0 голосов
/ 09 апреля 2020

Очень простой ответ на этот вопрос - ни один из вышеперечисленных. Это очень вводящее в заблуждение сообщение об ошибке, особенно когда код, который вы написали, был разработан для сохранения бинарного файла со странным расширением.

На самом деле это означает ...

    I HAVE NO IDEA HOW TO DISPLAY THIS DATA ! - Yours Jupyter

Итак, go в вашем проводнике, Finder перейдите к только что сохраненному файлу и откройте его. Вуаля! Все работало в точности так, как планировалось, ошибки нет.

Надеюсь, это сэкономит другим людям много часов отладки, и, пожалуйста, Jupyter, измените сообщение об ошибке.

...