Я не уверен, что отвечаю на ваш вопрос, но это может помочь:
Заголовки gzip содержат исходное имя файла и исходный размер несжатого файла. Подробности в RFC на http://www.gzip.org/zlib/rfc-gzip.html#member-format. Единственная хитрость при чтении заголовка заключается в том, что исходный размер файла находится после поля переменной длины, поэтому извлечение исходного размера файла не так просто, как чтение нескольких байтов из известного места.
Вы можете использовать команду "file" в * nix, чтобы легко извлечь некоторую информацию об исходном файле. Пример:
$ file schema.gz
schema.gz: сжатые gzip данные, были "схемой" из Unix, последнее изменение: суббота, 22 октября 18:10:20 2011