Создайте фиксированный и динамический заголовок c для кадра данных python - PullRequest
1 голос
/ 07 августа 2020

Я читаю файл gzip и конвертирую его в Dataframe описанным ниже методом.

   df = pd.read_csv(file.gz, compression='gzip', header=0, sep=',', quotechar='"', error_bad_lines=False)

Это фактически заполняет первую строку как заголовок столбца. Поскольку данные в gzip меняются каждый раз, когда изменяется заголовок столбца. Кроме того, нет фиксированного количества столбцов, оно также отличается в зависимости от файла, как показано ниже.

File 1 
        01-10-2019  Samsung    Owned
        -----------------------------
        01-10-2019  Samsung    Owned
        03-10-2019  Motorolla  Sold

File 2 
         SAMSUNG    Walmart    DHL    300$  Sold  Alaska
        --------------------------------------------------
        SAMSUNG    Walmart    DHL     300$  Sold  Alaska   
        Sony       Motorolla  Fedex   250$  Sold  Chicago
    

Для меня было бы отлично, если у меня есть фиксированный столбец как 1,2,3 в зависимости от количества столбцов, которые имеет фрейм данных, например

 File 1 
            1            2         3
            -----------------------------
            01-10-2019  Samsung    Owned
            03-10-2019  Sony       Sold
File 2 
          1         2         3        4    5      6
        --------------------------------------------------
        SAMSUNG    Walmart    DHL     300$  Sold  Alaska   
        Sony       Motorolla  Fedex   250$  Sold  Chicago

1 Ответ

0 голосов
/ 07 августа 2020

Если я вас правильно понял, вы не хотите читать заголовок из csv файла. Это можно сделать с помощью header=None. Если ваш CSV-файл содержит заголовок, который вы хотите игнорировать, вы также можете добавить skiprows=1.

df = pd.read_csv(file.gz, compression='gzip', header=None, sep=',', quotechar='"', error_bad_lines=False)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...