У меня есть огромный файл, состоящий из символов «0», «1», «2», «3».Нет пробелов, ничего больше.Просто эти 4 персонажа.Я использовал bzip2, чтобы сжать его, и размер файла уменьшился с X до 0,05 * X.Я хотел бы знать, какие строки / шаблоны были найдены bzip2 для получения сжатой версии файла (например, 0123213232, 0123121212222112 и т. Д.).Есть ли простой способ извлечь эту информацию либо из фактического файла bz2, либо запустив bzip2 с какой-либо специальной опцией командной строки?
Если вы знаете ответ для какой-либо другой существующей программы сжатия, я также будуинтересно услышать об этом.
Спасибо за любую помощь.
Best, Surikator.