Как можно сравнить различные форматы сжатия? - PullRequest
3 голосов
/ 27 июля 2011

Я хотел бы знать, существует ли стандартизированный метод сравнения форматов сжатия файлов.

Существует ли стандартный набор файлов, с которым возможно сравнение эффективности сжатия?

Если вы выбираете большое количество файлов, имеет ли значение, какие типы файлов вы выберете для сравнения степени сжатия различных алгоритмов? (Чтобы было ясно: я знаю, что степень сжатия одного алгоритма варьируется, если вы выбираете разные файлы. Я хотел бы знать, может ли один алгоритм иметь для набора из 100 000 файлов степень сжатия 5% и алгоритм b имеет 2%, но для другого набора из 100 000 файлов алгоритм a будет иметь 1%, а алгоритм b 2%. Таким образом, для одного набора a лучше, для другого b. Возможно ли это для большого набора файлов?)

1 Ответ

2 голосов
/ 27 июля 2011

Хотя я бы не сказал, что он стандартизирован, есть некоторые корпуса, которые часто используются для сравнения различных алгоритмов сжатия.Например, проверьте Calgary Corpus или Canterbury Corpus.

Даже если вы выбираете большое количество файлов, имеет значение, какие типы файлов вы выбираете, так как степень сжатия будет варьироваться в зависимости от того, насколько подходят реальные данныебазовая модель, предполагаемая алгоритмом сжатия.

Проверьте этот сайт и этот сайт , чтобы просмотреть сравнение результатов сжатия для различных типов данных.

...