Сбор нескольких таблиц Excel в один большой DataFrame - PullRequest
0 голосов
/ 26 мая 2020

У меня есть папка с несколькими файлами excel (все имеют одинаковые заголовки, и я пытаюсь объединить информацию в DataFrame, у меня возникли проблемы с созданием al oop, который выполняет итерацию по каждому файлу и объединяет их вместе Проблема в том, что он продолжается для 30+ файлов в папке и просто печатает одну и ту же информацию снова и снова.

import os
import glob
import pandas as pd

dfs = []
path = '/users/.../.../.../folder'
files = os.listdir(path)
print (files)

datafiles = glob.glob(path + "/*.xlsx")
for datafile in datafiles:
    dfs.append(pd.read_excel(datafiles)

for datafile in datafiles:
    dfs.append(pd.read_excel(datafile))

big_frame = pd.concat(dfs, ignore_index=True) 
print(big_frame)

for df in dfs:
    big_frame.append(dfs, ignore_index=True)
    print(dfs) 

Какую ошибку я делаю? Теоретически на выходе должен быть один большой фрейм данных со всей информацией из более чем 30 файлов, добавленных вместе.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...