Я извлекаю некоторые файлы gz в Python с помощью модуля gzip. В некоторых файлах я получаю символы, которые не являются частью исходного файла. Если я извлекаю файл, используя 7-Zip в Windows, я получаю ожидаемый файл. Ниже приведен снимок экрана с записью проблемных символов c после извлечения gzip:
Снимок экрана, показывающий проблемные символы.
![problematic record](https://i.stack.imgur.com/IBxEx.png)
Код, используемый для извлечения файла, приведен ниже:
with gzip.open(source_filepath, 'rb') as s_file, \
open(dest_filepath, 'wb') as d_file:
#s_file.seek(3)
shutil.copyfileobj(s_file, d_file, block_size)
s = open(dest_filepath, mode='r', encoding='utf-8-sig').read()
open(dest_filepath, mode='w', encoding='utf-8').write(s)
print('File unzipped.')
Есть идеи, почему это происходит?