У меня есть несколько CSV-файлов в папке.Цель состоит в том, чтобы добавить файлы csv в один фрейм pd.
Вопрос в том, как мы можем использовать панд для объединения всех файлов в папке, но в то же время ассоциировать определенные ключи с каждым из фрагментовразделенный DataFrame с использованием аргумента keys: keys
.
Это означает, что теперь мы можем выбирать каждый блок по ключу:
Например, учитывая два файла CSV в папке, каждыйCSV имеют 3 столбца (A, B, C) и две строки.
CSV-файл: Book1
A0 B0 C0
A1 B1C1
и
CSV-файл: Book2
A2 B2 C2
A3 B3 C3
Ожидаемыйкадры, как показано на рисунке.
![enter image description here](https://i.stack.imgur.com/FY8pY.jpg)
Обратите внимание на индексы Book1 и Book2 в левом столбце.Это имя происходит из указанного CSV-файла.
Пока у меня есть следующий код
# match the pattern ‘csv’ in the folder
extension = 'csv'
all_filenames = [i for i in glob.glob('*.{}'.format(extension))]
Но где под следующей строкой кода мне нужно изменить, чтобы достичь указанной цели?
combined_csv = pd.concat([pd.read_csv(f) for f in all_filenames ])
Причина добавления этих ключей заключается в том, чтобы облегчить доступ в будущем.Этого обычно можно добиться от
.loc['Book1']