Сравнение двух или более файлов .csv с указанием различий в парах столбцов - PullRequest
0 голосов
/ 25 января 2020

У меня есть несколько файлов CSV со всеми строками, отформатированными так:

123;A;300;B
124;A;300;C

125;M;130;O

...

Я хочу сравнить несколько таких файлов CSV. Для этого я хочу сформировать список для каждого уникального элемента второго столбца. Список должен содержать все элементы четвертого столбца (порядок не имеет значения), которые встречаются со вторым элементом столбца в строке файла.

Так что для моего примера списки будут:

[A, [B, C]]
[M, [O]]

Я хочу создать эти списки для каждого из моих файлов, а затем сравнить списки с одним и тем же первым элементом (индексом), например, сравнить: [A, [B, C]] с [A, [C, D]]. Я хочу сравнить только между файлами, а не в одном файле. Если разница обнаружена, она должна вернуть или распечатать информацию о том, где была обнаружена разница, и указать строку / строки в файле csv, где можно найти соответствующие элементы.

Я думал об этом с помощью pandas, но я не совсем уверен, как правильно настроить списки.

Если бы вы могли мне помочь, я был бы очень благодарен.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...