pandas .read_csv файла gzip в заархивированном каталоге - PullRequest
1 голос
/ 13 марта 2020

Я хотел бы использовать pandas .read_csv, чтобы открыть файл gzip (.as c .gz) в заархивированном каталоге (.zip). Есть ли простой способ сделать это?

Этот код не работает:

csv = pd.read_csv (r 'C: \ folder.zip \ file.as c .gz ') // не могу найти файл

Этот код работает (однако, мне нужно распаковать папку, чего я хочу избежать, потому что мой набор данных в настоящее время содержит тысячи папок с zip-файлами):

csv = pd.read_csv (r 'C: \ folder \ file.as c .gz')

Есть ли простой способ сделать это? Я попытался использовать комбинацию zipfile.Zipfile и read_csv, но безуспешно (я думаю, что отчасти это связано с тем, что это также и файл ascii)

1 Ответ

0 голосов
/ 13 марта 2020

Может быть, могут помочь следующие.

df = pd.read_csv('filename.gz', compression='gzip')

ИЛИ

import gzip
file=gzip.open('filename.gz','rb')
content=file.read()

...