У меня есть несколько папок и подпапок, содержащих книги Excel с несколькими вкладками. Как мне преобразовать всю информацию в 1-й панду?
Вот мой код:
from pathlib import Path
import os
import pandas as pd
import glob
p = Path(r'C:\Users\user1\Downloads\key_folder')
globbed_files = p.glob('**/**/*.xlsx')
df = []
for file in globbed_files:
frame = pd.read_excel(file, sheet_name = None, ignore_index=True)
frame['File Path'] = os.path.basename(file)
df.append(frame)
# df = pd.concat([d.values() for d in df], axis = 0, ignore_index=True)
df = pd.concat(df, axis=0, ignore_index = True)
Это генерирует следующую ошибку:
cannot concatenate object of type "<class 'collections.OrderedDict'>"; only pd.Series, pd.DataFrame, and pd.Panel (deprecated) objs are valid
Когда я запустил pd.DataFrame(df)
, я увидел, что каждая вкладка электронной таблицы Excel представляет собой отдельный столбец. Ячейки содержат данные и заголовки в текстовом виде, образуя действительно длинную строку.
Любая помощь приветствуется! Спасибо!