Какой лучший алгоритм сжатия для дампов данных - PullRequest
1 голос
/ 20 мая 2011

Я создаю дампы данных с моего сайта, чтобы другие могли их загружать и анализировать.Каждый дамп будет гигантским XML-файлом.

Я пытаюсь найти лучший алгоритм сжатия, который:

  • Эффективно сжимает (с CPU)
  • Делает наименьший возможный файл
  • Довольно распространен

Я знаю основы сжатия, но не знаю, какой алгоритм соответствует требованиям.Я буду использовать MySQL и Python для генерации дампа, поэтому мне понадобится кое-что с хорошей библиотекой Python.

1 Ответ

3 голосов
/ 20 мая 2011

GZIP со стандартным уровнем сжатия должен подойти для большинства случаев.Более высокие уровни сжатия = больше процессорного времени.BZ2 упаковывается лучше, но также медленнее.Что ж, всегда есть компромисс между потреблением процессора / временем работы и эффективностью сжатия ... все сжатия с уровнями сжатия по умолчанию должны быть в порядке.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...