Мы пытаемся создать автоматическую программу, которая может взять несколько файлов Excel с несколькими листами из папки и добавить их в один фрейм данных.
Наша проблема в том, что мы не совсем уверены, как это сделать, поэтому процесс становится максимально автоматическим.И так как листы различаются по именам, мы не можем указывать для них переменные.
Все файлы * .xlsx, и код должен загружать произвольное количество файлов.
Мы пробовали разные типы кодов, в основном с использованием панд, но мы можем 'кажется, добавить их в один фрейм данных.
import numpy as np
import pandas as pd
import glob
all_data = pd.DataFrame()
for f in glob.glob("*.xlsx"):
df = pd.read_excel(f)
all_data = all_data.append(df, ignore_index=True)
# now save the data frame
writer = pd.ExcelWriter('output.xlsx')
all_data.to_excel(writer)
writer.save()
sheet1 = xls.parse(0)
Мы ожидаем, что у нас будет один фрейм данных со всеми данными, чтобы мы могли использовать данные, извлекать различные функции и создавать статистику.