Я импортировал Excel в массив данных.Это выглядит так:

Затем я использовал код для группировки этих данных в соответствии с 'tx_id' и создания отдельного csv с именем tx_id, котороедает мне такие данные (3e6737ae-c3af-4d19-a645-d17fc73dbb7c.csv).Это код:
for i, g in dframe.groupby('tx_id'):
g.to_csv('{}.csv'.format(i.split('/')[0]), index=False)
Затем я создал отдельный dframe, содержащий только tx_id, а затем удалил дубликаты, используя этот код:
dframe1 = dframe1.drop_duplicates()
Теперь мой фрейм данных выглядит так:

Я преобразовал этот кадр данных в CSV.Теперь я хочу сравнить имена файла CSV (который является значением tx_id) с данными, присутствующими во вновь созданном CSV, и если имена совпадают, я хотел бы прочитать файл CSV (который является значением tx_id) вdataframe.Раньше я импортировал эти CSV-файлы вручную, но у меня большой набор данных, для меня не представляется возможным каждый раз читать данные и выполнять дальнейшие действия с ними.Сейчас я занимаюсь импортом файлов CSV по отдельности в фрейм данных.Я использую этот код:
df = pd.read_csv(' ae229a81-bb33-4cf1-ba2f-360fffb0d94b.csv')
Это дает мне такой результат:

Затем я использовал его для снятия иприменить value_counts с помощью этого кода:
df1 = df.groupby('rule_id')['request_id'].value_counts().unstack().fillna(0)
И конечный результат, который выглядит следующим образом:

Я хочуавтоматизировать этот процесс, и я не знаю как.Ребята, вы можете мне помочь?