У меня есть папка с несколькими CSV-файлами, названными так CINinfo_2019-08-08_rev1, CINinfo_2019-08-08_rev2, CINinfo_2019-08-08_rev3, CINinfo_2019-08-08_rev4, У меня около 70 файлов вВ одной папке я собираюсь автоматизировать этот процесс, чтобы я мог автоматически читать их по две пары, а затем сравнивать различия в каждой паре и получать результат в виде одной объединенной таблицы. В настоящее время я читаю их вручную и сравниваю различия. Вот код:
import pandas as pd
df1 = pd.read_csv("CINinfo_2019-08-08_rev1.csv")
df2 = pd.read_csv("CINinfo_2019-08-08_rev2.csv")
import numpy as np
rows,cols=np.where(comparison_values==False)
for item in zip(rows,cols):
df1.iloc[item[0], item[1]] = '{} --> {}'.format(df1.iloc[item[0], item[1]],df2.iloc[item[0], item[1]])
Этот процесс настолько утомителен, что у меня есть другие папки с файлами CSV, которые мне нужно прочитать. Примечание как называются файлы CSV, все файлы CSV имеют одинаковые префиксы ( CINinfo_2019-08-08_ ), но суффикс в этом имени дела ( rev ) имеетинкрементное число от 1 до 70. Мне нужно это для чтения файлов попарно в формате 1 и 2 , 2 и 3, 3 и 4 продолжается. В этом случае я сравниваю такие пары, как CINinfo_2019-08-08_rev1 и CINinfo_2019-08-08_rev2 затем CINinfo_2019-08-08_rev2 и CINinfo_2019-08-08_rev3 происходит так, как можноЯ автоматизирую чтение этих файлов попарно, затем сравниваю различия в каждой из них и получаю по одной объединенной таблице?