Как обработать zipfile с помощью Julia - PullRequest
0 голосов
/ 08 мая 2018

Я изо всех сил пытаюсь работать с заархивированными файлами, например ::10000

julia> using CodecZlib

julia> text = open("2004_CORE.zip")
IOStream(<file 2004_CORE.zip>)

У меня есть несколько таких файлов для обработки. Каждый из них будет содержать как минимум один сжатый xml-файл и один или несколько CSV-файлов в виде простого текста.

Мой вопрос: как определить, какие файлы и типы файлов содержатся в zip-файле? И как мне транслировать эти файлы отдельно, чтобы иметь возможность обрабатывать XML-файлы с LightXML и CSV-файлы с DataFrames?

1 Ответ

0 голосов
/ 08 мая 2018

zlib самостоятельно не обрабатывает zip-файлы. Обратите внимание, что zip и gzip - это две разные вещи. Вам нужно что-то, что анализирует формат файла zip. ZipFile может помочь.

Если вы не хотите использовать ZipFile, который называется медленным, то вам нужно будет самостоятельно выбрать формат файла zip. Вы можете найти это документально здесь . Затем вы можете использовать функциональность deflate в CodecZlib для распаковки необработанных данных deflate, содержащихся в каждой записи zip-файла. (Почти во всех zip-файлах используются только методы deflate или сохраненные методы.)

...