Я пытаюсь быстро оценить номер строки сжатых файлов. Я делаю это путем проверки несжатого размера файла, выборки строк в начале файла с помощью zcat filename | head -n 100
(например) и деления несжатого размера на средний размер строки в этой выборке из 100 строк.
Проблема в том, что данные, которые я получаю от gzip -l, неверны. В основном кажется, что несжатый размер слишком мал, в некоторых случаях получая отрицательные значения сжатия. Например, в одном случае сжатый файл имеет размер 1,8 ГБ, а несжатый файл указан как 0,7 ГБ с помощью gzip -l, когда он фактически равен 9 ГБ при распаковке. Я пытался распаковать и повторно сжать, но все равно получил тот же размер без сжатия.
gzip 1.6 на Ubuntu 18.04.3