Добавление имени файла в заголовок столбца в кадре данных - PullRequest
1 голос
/ 07 августа 2020

У меня есть фрейм данных, который я создал путем слияния одного столбца из 7 разных файлов Excel. Ниже приведен код, который я использовал:

import pandas as pd
import glob

my_excel_files = glob.glob(r"C:\Users\.........\*.xlsx")

total_dataframe = pd.DataFrame() 

for file in my_excel_files:
    new_df = df['Comments']
    total_dataframe = pd.concat([total_dataframe, new_df], axis=1) # Puts together all Comments columns

Как вы можете видеть из кода, я беру столбец «Комментарии» из каждого Excel и помещаю их вместе в новый df, единственная проблема в том, что я хочу быть возможность добавить имя файла в имя столбца, чтобы я знал, какой столбец из какого файла Excel, все они прямо сейчас называются «Комментарии». Так что в идеале одним из заголовков столбца будет «Комментарии (first_response.xlsx)»

1 Ответ

1 голос
/ 07 августа 2020

позволяет использовать pathlib и pd.concat

, используя понимание dict, мы можем получить атрибут .name из объекта pathlib, и при использовании concat имя файла будет установлено как индекс.

from pathlib import Path


dfs = pd.concat({f.name : pd.read_excel(f) for f in Path(r'C:\Users\..').glob('*.xlsx')})

это создаст индекс с именем файла, вы можете reset_index, если хотите разместить его как столбец.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...