У меня есть несколько общих вопросов, касающихся библиотеки java.util.zip
.
В основном мы занимаемся импортом и экспортом множества мелких компонентов. Ранее эти компоненты импортировались и экспортировались с использованием одного большого файла, например:
.
<component-type-a id="1"/>
<component-type-a id="2"/>
<component-type-a id="N"/>
<component-type-b id="1"/>
<component-type-b id="2"/>
<component-type-b id="N"/>
Обратите внимание, что порядок компонентов при импорте имеет значение.
Теперь каждый компонент должен занимать свой собственный файл, который должен иметь внешнюю версию, QA-ed, bla, bla. Мы решили, что результатом нашего экспорта должен быть файл zip (со всеми этими файлами), а вход нашего импорта должен быть похожим файлом zip. Мы не хотим взрывать почтовый индекс в нашей системе. Мы не хотим открывать отдельные потоки для каждого из маленьких файлов. Мои текущие вопросы:
Q1. Может ли ZipInputStream
гарантировать, что записи zip (маленькие файлы) будут прочитаны в том же порядке, в котором они были вставлены нашим экспортом, использующим ZipOutputStream
? Я предполагаю, что чтение что-то вроде:
ZipInputStream zis = new ZipInputStream(new BufferedInputStream(fis));
ZipEntry entry;
while((entry = zis.getNextEntry()) != null)
{
//read from zis until available
}
Я знаю, что центральный zip-каталог находится в конце zip-файла, но, тем не менее, записи в нем имеют последовательный порядок. Я также знаю, что полагаться на приказ - ужасная идея, но я просто хочу иметь в виду все факты.
Q2. Если я использую ZipFile
(что я предпочитаю), каково влияние на производительность вызова getInputStream()
сотни раз? Будет ли это намного медленнее, чем решение ZipInputStream
? Почтовый индекс открывается только один раз, а ZipFile
поддерживается RandomAccessFile
- это правильно?
Я предполагаю, что чтение что-то вроде:
ZipFile zipfile = new ZipFile(argv[0]);
Enumeration e = zipfile.entries();//TODO: assure the order of the entries
while(e.hasMoreElements()) {
entry = (ZipEntry) e.nextElement();
is = zipfile.getInputStream(entry));
}
Q3. Безопасны ли входные потоки из одного потока ZipFile
(например, могу ли я одновременно читать разные записи в разных потоках)? Какие-либо штрафы за производительность?
Спасибо за ваши ответы!