У меня есть файл .csv.gz размером 100 ГБ в удаленном Linux.Я определенно не хочу разархивировать его, потому что размер достигнет 1T.
Я ищу в Интернете для чтения файлов.Я увидел здесь предложение
python: читать строки из сжатых текстовых файлов
gzip?панды?итератор?
Мой наставник предложил разархивировать данные после распаковки.
Мне также нужно было бы рассмотреть память.Так что readlines () определенно не мое рассмотрение.
Интересно, найдется ли у кого-нибудь оптимальное решение для этого, потому что файл действительно большой, и мне понадобится много времени, чтобы просто что-нибудь сделать.