Получение неожиданных символов с помощью gzip () - PullRequest
0 голосов
/ 19 марта 2020

Я извлекаю некоторые файлы gz в Python с помощью модуля gzip. В некоторых файлах я получаю символы, которые не являются частью исходного файла. Если я извлекаю файл, используя 7-Zip в Windows, я получаю ожидаемый файл. Ниже приведен снимок экрана с записью проблемных символов c после извлечения gzip:

Снимок экрана, показывающий проблемные символы.

problematic record

Код, используемый для извлечения файла, приведен ниже:

with gzip.open(source_filepath, 'rb') as s_file, \
          open(dest_filepath, 'wb') as d_file:
    #s_file.seek(3)
    shutil.copyfileobj(s_file, d_file, block_size)
    s = open(dest_filepath, mode='r', encoding='utf-8-sig').read()
    open(dest_filepath, mode='w', encoding='utf-8').write(s)
    print('File unzipped.')

Есть идеи, почему это происходит?

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...