Bzip2 сжимает в большие блоки (по-моему, 900 КиБ).Один метод, который значительно ускорит сканирование файла tar, , но , снизит производительность сжатия, - это сжатие каждого файла по отдельности, а затем сжатие результатов.По сути, это файлы Zip-формата (хотя они используют сжатие zlib, а не bzip2).Но вы могли бы легко получить индекс tar и распаковать только те файлы, которые вы ищете.
Я не думаю, что большинство tar
программ предлагают большие возможности для организации файлов в любом значимомКстати, вы могли бы написать программу для этого в вашем особом случае (я знаю, что в Python есть библиотеки для записи tar, хотя я использовал их только один или два раза).Однако у вас все еще будет проблема распаковки большинства данных, прежде чем вы найдете то, что искали.