у меня есть около 1000 файлов Excel, расположенных в одной папке:
C: / BD / КЕН
все файлы имели формат имен:
'Кен <#> от .xlsx'
Мне нужно было прочитать все файлы, таблицу с первого листа, а затем объединить все в один фрейм данных для дальнейшей манипуляции и иметь ОДИН БОЛЬШОЙ файл Excel для работы:
import pandas as pd
import os
#list of <#> series of excel files (around 1000 files total)
names = ['1125','1126','1127']
#column names
ColNames = ['a', 'b', 'c','d','e','f','g','h']
#empty dataframe
df = pd.DataFrame(columns=ColNames)
for x,y,z in os.walk('C:/BD/KEN'):
for i in z:
if i.split()[1] in names:
print(i)
try:
temp = pd.read_excel('C:/BD/KEN'+i)
except:
print('ALERT')
df.append([temp])
df.to_excel('C:/BD/TOTAL.xlsx', index=None)
print('DONE")
os.walk создает кортежи (путь к папке, имя папки, имя файла)
так что 'z' - это имя файла как str