Я читаю файл gzip и конвертирую его в Dataframe описанным ниже методом.
df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False)
Это фактически заполняет первую строку как заголовок столбца. Поскольку данные в gzip меняются каждый раз, когда изменяется заголовок столбца. Кроме того, нет фиксированного количества столбцов, оно также отличается в зависимости от файла, как показано ниже.
File 1
01-10-2019 Samsung Owned
-----------------------------
01-10-2019 Samsung Owned
03-10-2019 Motorolla Sold
File 2
SAMSUNG Walmart DHL 300$ Sold Alaska
--------------------------------------------------
SAMSUNG Walmart DHL 300$ Sold Alaska
Sony Motorolla Fedex 250$ Sold Chicago
Для меня было бы отлично, если у меня есть фиксированный столбец как 1,2,3 в зависимости от количества столбцов, которые имеет фрейм данных, например
File 1
1 2 3
-----------------------------
01-10-2019 Samsung Owned
03-10-2019 Sony Sold
File 2
1 2 3 4 5 6
--------------------------------------------------
SAMSUNG Walmart DHL 300$ Sold Alaska
Sony Motorolla Fedex 250$ Sold Chicago