Я пытаюсь извлечь файл из .gz-файла (или распаковать его? Не знаю, какая здесь правильная номенклатура), используя python 3.8 (тоже пробовал 3.7) и gzip библиотека в Windows, но я получаю следующую ошибку:
gzip.BadGzipFile: Not a gzipped file (b'\r\n')
Вот файл, поэтому ошибка воспроизводима (это общедоступный файл):
https://www.dropbox.com/s/2cs9ik9nj2tfijh/15_07_U_2020-01-24.CAT.gz?dl=0
Чтобы извлечь его, я использую код из этого вопроса . Код:
import gzip
import shutil
with gzip.open('15_07_U_2020-01-24.CAT.gz', 'rb') as f_in:
with open('file.txt', 'wb') as f_out:
shutil.copyfileobj(f_in, f_out)
Кроме того, используя код из этого другого вопроса , я могу прочитать и просмотреть содержимое файла:
for data in gzip.GzipFile(file):
print(data)
Здесь, Я получаю ту же ошибку после печати всего файла.
Итак, кажется, что символы '\ r \ n', которые находятся в конце файла, вызывают ошибку. Но как я могу справиться с этим? Можно ли эту ошибку игнорировать или как-то удалить символы?
Кстати, я могу без проблем извлечь файл с WinRAR или 7z.