Заголовок файла csv.gz - PullRequest
       47

Заголовок файла csv.gz

2 голосов
/ 10 июня 2011

Я хотел бы знать, что если мой CSV-файл Gzip. (сначала не смолится, как tar.gz). И его расширение - FileName.csv.gz.

Каким будет заголовок файла в этом случае. Потому что мне нужно имя файла, информация о размере файла.

Когда я записал свой CSV в (FileName.tar). и затем я распаковал его (FileName.tar.gz). Я легко могу прочитать заголовок файла. Посмотрите здесь http://en.wikipedia.org/wiki/Tar_(file_format)#File_header

Спасибо.

1 Ответ

1 голос
/ 25 октября 2011

Я не уверен, что отвечаю на ваш вопрос, но это может помочь:

Заголовки gzip содержат исходное имя файла и исходный размер несжатого файла. Подробности в RFC на http://www.gzip.org/zlib/rfc-gzip.html#member-format. Единственная хитрость при чтении заголовка заключается в том, что исходный размер файла находится после поля переменной длины, поэтому извлечение исходного размера файла не так просто, как чтение нескольких байтов из известного места.

Вы можете использовать команду "file" в * nix, чтобы легко извлечь некоторую информацию об исходном файле. Пример:

$ file schema.gz schema.gz: сжатые gzip данные, были "схемой" из Unix, последнее изменение: суббота, 22 октября 18:10:20 2011

...