Создайте Pandas Dataframe из имен указанных столбцов в Excel, таких как pd.read_csv или pd.read_excel - PullRequest
0 голосов
/ 08 марта 2020

С помощью pd.read_csv или pd.read_excel я легко могу создать Dataframe из указанных столбцов файла csv или Excel.

Но в некоторых случаях я могу использовать только файл Excel, и pd.read_excel тоже работает медленно, и я слышу, что мы можем использовать Xlwings для ускорения.

Я пытался искать много раз, но не могу найти, как создать Pandas Dataframe из имен указанных столбцов в Excel (мой файл имеет сотни столбцов и мне просто нужно использовать немного). Ваша помощь очень ценится.

1 Ответ

1 голос
/ 08 марта 2020

pandas:

Вы можете использовать следующий код, чтобы прочитать имена и значения указанных столбцов:

 pd.read_excel('path\\filename.xlsx', sheet_name='products', usecols="B:E")

, чтобы узнать больше о ссылке «usecols» документация .

Xlwings:

Чтобы установить xlwings через pip или conda, см. Эту документацию .

Вы можете использовать следующий код для чтения имен и значений указанных столбцов:

import xlwings as xw 
wb = xw.Book(r'path\\filename.xlsx')
sht = wb.sheets['products'] #add your sheetname of your excel file.
sht.range('B1:E1').value #read specified columns names
output: [' date     ', 'item_id', 'revenue', 'revenue1', 'revenue2']
sht.range('B1:E1').expand().value #read specified columns names & values.
output: [['item_id', 'revenue', 'revenue1', 'revenue2'], [59.0, 22131846.0, 1212.0, 3223.0], [60.0, 22131847.0, 1213.0, 3224.0]]

пример таблицы: output

Надеюсь, это поможет.

...