У меня есть ряд папок подкаталогов, каждая из которых имеет "_Invoice.csv".
/Invoice List/
Invoice1folder/
..._Invoice.csv
Invoice2folder/
..._Invoice.csv
Invoice5folder/
..._Invoice.csv
Invoice9folder/
_Invoice.csv
С каждым "_Invoice.csv" у меня есть столбцы [A, B, C, D].Я пытаюсь выполнить рекурсивный поиск по всем папкам подкаталогов, открыть каждый файл "_Invoice.csv" и уменьшить столбцы только до [A, C], а затем сохранить его как "_Invoice_Reduced.csv".
"_Invoice.csv" "_Invoice_Reduced.csv"
A B C D => A C
1 2 3 4 => 1 3
Моя текущая попытка:
import pandas as pd
import os
columns_to_keep = ['A','C']
final_form= pd.DataFrame()
for file in os.listdir():
if file.endswith('*_Invoice.csv'):
df = pd.read_csv(file)
df = df.loc[;columns_to_keep]
df = df.to_csv(f'{file.name}_Invoice_Reduced.csv')
if file.endswith('*_Invoice_Reduced.csv'):
df = pd.read_csv(file)
final_form= final_form.append(df, ignore_index=True)
TLDR: я пытаюсь создать сценарий, который входит в каждый подкаталог, уменьшает существующий ранее CSV, уменьшает столбцы CSVвниз и сохранить подмножество.Затем, после прочтения всех подкаталогов, объедините уменьшенные файлы в один большой_фрейм.
Есть мысли?