У меня есть 6 .xlsx файлов.С помощью следующего кода я сохраняю один из них в фрейме данных с именем "df_documents":
df_documents = pd.read_excel(path_input+name_DOCUMENTSESSENTIAL+fileending_input,
names=column_DOCUMENTSESSENTIAL)
Из-за размера файла xlsx я провел некоторые исследования, чтобы ускорить его.Многопроцессорная обработка была подходящим способом:
def read_csv(filename):
return pd.read_excel('input/' + filename)
def main():
pool = Pool(processes=8)
files = os.listdir('input/')
file_list = [filename for filename in files if filename.split('.')[1] == 'xlsx']
df_list = pool.map(read_csv, file_list)
print(df_list)
if __name__ == '__main__':
main()
print("--- %s seconds ---" % (time.time() - start_time))
Как я могу получить доступ к различным фреймам данных из "return pd.read_excel"?Есть ли способ дать им конкретные имена?Мне известно, что у меня есть доступ к «df_list», но я не знаю, в каком файле находится какой фрейм данных df_list [число].