Я ударил стену.Пока что есть следующий код:
# define variables of each directory to be used
parent_data_dir = 'C:\\Users\\Admin\\Documents\\Python Scripts\\Data\\'
orig_data_dir = 'C:\\Users\\Admin\\Documents\\Python Scripts\\Data\\Original\\'
new_data_dir = 'C:\\Users\\Admin\\Documents\\Python Scripts\\Data\\New\\'
# Create list of original data files from orig_data_dir
orig_data = []
for root, dirs, files in os.walk(orig_data_dir):
for file in files:
if file.endswith('.csv'):
orig_data.append(file)
# It populates the file names located in the orig_data_dir
# orig_data = ['Test1.csv', 'Test2.csv', 'Test3.csv']
# Create list of new data files from new_data_dir
new_data = []
for root, dirs, files in os.walk(new_data_dir):
for file in files:
if file.endswith('.csv'):
new_data.append(file)
# It populates the file names located in the orig_data_dir
# orig_data = ['Test1_2.csv', 'Test2_2.csv', 'Test3_2.csv']
У меня есть три CSV-файла в каждом каталоге.CSV-файлы, заканчивающиеся на _2.csv, содержат новые данные, которые я хотел бы добавить к старым данным в новый CSV-файл для каждой соответствующей пары.Каждый CSV-файл имеет одинаковые строки.Я пытаюсь сделать следующее:
- Считать Test1.csv и Test1_2.csv в один фрейм данных, используя созданные мной списки (если лучше, я открыт для этого) (следующая итерация =Test2.csv и Test2_2.csv и т. Д.)
- Выполните некоторые действия с пандами
- Напишите новый файл с именем Test_Compiled_1.csv (следующая итерация = Test_Compiled_2.csv и т. Д.)
- Повторяйте до тех пор, пока каждая пара CSV из двух каталогов не будет объединена в новый файл CSV для каждой пары.
РЕДАКТИРОВАТЬ: у меня есть тысячи файлов CSV.С учетом сказанного мне нужно:
прочитать в первой паре файлов на одном и том же кадре данных: 1-я итерация: Test1.csv, расположенный в orig_data_dir, и Test1_2.csv, расположенный в new_data_dir
делать панды вещи
записать заполненный кадр данных в новый файл в parent_data_dir
Повторите для каждогопара файлов
2-я итерация будет: Test2.csv и Test2_2.csv
1000 итерация будет: Test1000.csv и Test1000_2.csv
Надеюсь, это поможет уточнить.