Ошибка при распаковке .gz файла в python - PullRequest
0 голосов
/ 28 апреля 2020

Я пытаюсь извлечь файл из .gz-файла (или распаковать его? Не знаю, какая здесь правильная номенклатура), используя python 3.8 (тоже пробовал 3.7) и gzip библиотека в Windows, но я получаю следующую ошибку:

gzip.BadGzipFile: Not a gzipped file (b'\r\n')

Вот файл, поэтому ошибка воспроизводима (это общедоступный файл):

https://www.dropbox.com/s/2cs9ik9nj2tfijh/15_07_U_2020-01-24.CAT.gz?dl=0

Чтобы извлечь его, я использую код из этого вопроса . Код:

import gzip
import shutil
with gzip.open('15_07_U_2020-01-24.CAT.gz', 'rb') as f_in:
    with open('file.txt', 'wb') as f_out:
        shutil.copyfileobj(f_in, f_out)

Кроме того, используя код из этого другого вопроса , я могу прочитать и просмотреть содержимое файла:

for data in gzip.GzipFile(file):
    print(data)

Здесь, Я получаю ту же ошибку после печати всего файла.

Итак, кажется, что символы '\ r \ n', которые находятся в конце файла, вызывают ошибку. Но как я могу справиться с этим? Можно ли эту ошибку игнорировать или как-то удалить символы?

Кстати, я могу без проблем извлечь файл с WinRAR или 7z.

...