Чтение нескольких файлов Excel в каталоге и добавление к фрейму данных Pandas - PullRequest
0 голосов
/ 06 июня 2019

Все файлы находятся в каталоге:

C:/BD/KENYA/<file name>.xlsx

Все файлы имеют следующий формат имени:

'Kenya 1686 dated 20.03.19'

Итак, есть два параметра, которые меняются:

1686 (идентификационный номер) и 20.03.19 (дата)

Панды хорошо читают полный путь:

pd.read_excel('C:/BD/KENYA/Kenya 1686 dated 20.03.19.xlsx')

Но как мне пройти через набор файлов (около 1900 элементов), считывая данные из них и суммируя все в Dataframe?

Я попытался поместить путь в переменную:

path = 'C:/BD/KENYA/Kenya 1686 dated 20.03.19.xlsx'

Это тоже работает. Но мне не удается объединить части пути к файлу.

os.abspath - не работает.

path = 'C:/BD/KENYA/Kenya 1686 dated 20.03.19.xlsx'
df = pd.read_excel(path)

В результате мне нужен DataFrame, созданный из нескольких файлов Excel.

1 Ответ

0 голосов
/ 06 июня 2019
import glob
import os
import pandas as pd

path = 'C:/BD/KENYA/'
files = glob.glob(os.path.join(path, 'Kenya * dated *')
df_all = None
for file in files:
  df = pd.read_excel(file)
  if not df_all:
    df_all = df
  else:
    df = df.append(df)
df_all.to_excel('C:/BD/KENYA/Kenya 1686 dated 20.03.19.xlsx')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...