У меня есть более 1000 CSV-файлов, я хочу объединить, где первые пять цифр CSV-файла совпадают в одном CSV-файле.
input:
100044566.csv
100040457.csv
100041458.csv
100034566.csv
100030457.csv
100031458.csv
100031459.csv
import pandas as pd
import os
import glob
path_1 =''
all_files_final = glob.glob(os.path.join(path_1, "*.csv"))
names_1 = [os.path.basename(x1) for x1 in all_files_final]
final = pd.DataFrame()
for file_1, name_1 in zip(all_files_final, names_1):
file_df_final = pd.read_csv(file_1,index_col=False)
#file_df['file_name'] = name
final = final.append(file_df_final)
final.to_csv('',index=False)
Я использовал приведенный выше код, но он объединяет все файлы в один CSV-файл, я не знаю, нужно ли выбирать на основе имени
так сверху ввод
Выход 1: объединить первые три CSV-файла в один CSV-файл, потому что первые пять цифр имени файла совпадают.
вывод 2: объединить следующие 4 файла в один CSV-файл, поскольку первые пять цифр имени файла совпадают.