У меня есть несколько файлов CSV со всеми строками, отформатированными так:
123;A;300;B
124;A;300;C
125;M;130;O
...
Я хочу сравнить несколько таких файлов CSV. Для этого я хочу сформировать список для каждого уникального элемента второго столбца. Список должен содержать все элементы четвертого столбца (порядок не имеет значения), которые встречаются со вторым элементом столбца в строке файла.
Так что для моего примера списки будут:
[A, [B, C]]
[M, [O]]
Я хочу создать эти списки для каждого из моих файлов, а затем сравнить списки с одним и тем же первым элементом (индексом), например, сравнить: [A, [B, C]]
с [A, [C, D]]
. Я хочу сравнить только между файлами, а не в одном файле. Если разница обнаружена, она должна вернуть или распечатать информацию о том, где была обнаружена разница, и указать строку / строки в файле csv, где можно найти соответствующие элементы.
Я думал об этом с помощью pandas, но я не совсем уверен, как правильно настроить списки.
Если бы вы могли мне помочь, я был бы очень благодарен.