для полноты пользы напишите мой комментарий в качестве ответа:
компрессия!CSV - просто причудливый способ сказать, что это текст с запятыми, это простой текстовый файл.С другой стороны, xlsx - это двоичный формат, и программы, которые генерируют этот формат, сжимают данные, если ваши данные в основном совпадают, что, как я полагаю, объясняется тем, что пути в основном одинаковы, то его высокая степень сжатия, чтовы видите
xlsx использует zip (по крайней мере, по данным Google)
, чтобы проверить это утверждение. Я создал файл ~ 110 МБ, содержащий случайные имена файлов с тем же путем, и использовал zlib
длясжать его, и результат был ~ 20MB
xlsx, вероятно, имеет дополнительные оптимизации, но я не копался в формате