Question

Я заметил, что функция распаковки в Java очень медленная по сравнению с использованием встроенного инструмента, такого как WinZip.

Существует ли сторонняя библиотека для Java, которая более эффективна?Предпочтителен открытый исходный код.

Редактировать

Здесь приведено сравнение скорости с использованием встроенного решения Java против 7zip.Я добавил буферизованные потоки ввода / вывода в свое оригинальное решение (спасибо Джиму, это действительно имело большое значение).

Zip Размер файла: 800K Java Решение: 2,7 секунды 7Zip решение: 204 мс

Вот модифицированный код, использующий встроенную декомпрессию Java:

/** Unpacks the give zip file using the built in Java facilities for unzip. */
@SuppressWarnings("unchecked")
public final static void unpack(File zipFile, File rootDir) throws IOException
{
  ZipFile zip = new ZipFile(zipFile);
  Enumeration<ZipEntry> entries = (Enumeration<ZipEntry>) zip.entries();
  while(entries.hasMoreElements()) {
    ZipEntry entry = entries.nextElement();
    java.io.File f = new java.io.File(rootDir, entry.getName());
    if (entry.isDirectory()) { // if its a directory, create it
      continue;
    }

    if (!f.exists()) {
      f.getParentFile().mkdirs();
      f.createNewFile();
    }

    BufferedInputStream bis = new BufferedInputStream(zip.getInputStream(entry)); // get the input stream
    BufferedOutputStream bos = new BufferedOutputStream(new java.io.FileOutputStream(f));
    while (bis.available() > 0) {  // write contents of 'is' to 'fos'
      bos.write(bis.read());
    }
    bos.close();
    bis.close();
  }
}

meriton · Answer 1 · 25 июля 2010

Проблема не в разархивировании, а в неэффективном способе записи разархивированных данных обратно на диск.Мои тесты показывают, что использование

    InputStream is = zip.getInputStream(entry); // get the input stream
    OutputStream os = new java.io.FileOutputStream(f);
    byte[] buf = new byte[4096];
    int r;
    while ((r = is.read(buf)) != -1) {
      os.write(buf, 0, r);
    }
    os.close();
    is.close();

вместо этого сокращает время выполнения метода в 5 раз (с 5 до 1 секунды для почтового файла размером 6 МБ).

Вероятный виновник - вашиспользование bis.available().Помимо неправильности (available возвращает число байтов до тех пор, пока не будет заблокирован вызов read, а не до конца потока), это обходит буферизацию, предоставляемую BufferedInputStream, требуя собственного системного вызова для каждого байта, скопированного в выходной файл.

Обратите внимание, что перенос в BufferedStream не является необходимым, если вы используете методы массового чтения и записи, как я делал выше, и что код для закрытия ресурсов не является безопасным для исключений (если чтение или запись по какой-либо причине дает сбойни is, ни os не будут закрыты).Наконец, если у вас есть IOUtils в пути к классам, я рекомендую использовать их хорошо проверенные IOUtils.copy вместо того, чтобы бросать свои собственные.

Jim Tough · Answer 2 · 24 июля 2010

Убедитесь, что вы используете метод распаковки BufferedInputStream в своем приложении Java. Если вы допустили ошибку при использовании небуферизованного входного потока, ваша производительность ввода-вывода гарантированно будет плохой.

Tony · Answer 3 · 25 июля 2010

Я нашел «не элегантное» решение. Существует бесплатная утилита с открытым исходным кодом 7zip (www.7-zip.org). Вы можете скачать версию командной строки (http://www.7 -zip.org / download.html ). 7-zip поддерживается только в Windows, но похоже, что он был перенесен на другие платформы (p7zip).

Очевидно, что это решение не является идеальным, поскольку оно зависит от платформы и опирается на исполняемый файл. Однако скорость по сравнению с распаковкой в Java невероятна.

Вот код для функции утилиты, которую я создал для взаимодействия с этой утилитой. Есть возможности для улучшения, так как приведенный ниже код относится только к Windows.

/** Unpacks the zipfile to the output directory.  Note: this code relies on 7-zip 
   (specifically the cmd line version, 7za.exe).  The exeDir specifies the location of the 7za.exe utility. */
public static void unpack(File zipFile, File outputDir, File exeDir) throws IOException, InterruptedException
{
  if (!zipFile.exists()) throw new FileNotFoundException(zipFile.getAbsolutePath());
  if (!exeDir.exists()) throw new FileNotFoundException(exeDir.getAbsolutePath());
  if (!outputDir.exists()) outputDir.mkdirs();

  String cmd = exeDir.getAbsolutePath() + "/7za.exe -y e " + zipFile.getAbsolutePath();

  ProcessBuilder builder = new ProcessBuilder(new String[] { "cmd.exe", "/C", cmd });
  builder.directory(outputDir);
  Process p = builder.start();
  int rc = p.waitFor();
  if (rc != 0) {
    log.severe("Util::unpack() 7za process did not complete normally.  rc: " + rc);
  }
}

Низкая производительность утилит распаковки Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Низкая производительность утилит распаковки Java

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 3 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Похожие темы