У меня проблема с тем, что мне нужно сравнить два больших файла CSV (примерно от 5 до 8 ГБ) и сделать третий файл CSV из их различий.
Любой указатель предложения для поддерживаемых библиотек для той же или любой ссылки для начала
например,
File 1.csv
+---+------+------+
|ID |value1|value2|
+---+------+------+
| 1| a| Ran1|
| 2| b| Ran2|
+---+-----+-------+
File 2.csv
+---+------+------+
|ID |value1|value2|
+---+------+------+
| 3| c| Ran3|
| 2| b| Ran2|
+---+-----+-------+
Schema of both file is same
Result - file 3.csv
File 2.csv
+---+------+------+
|ID |value1|value2|
+---+------+------+
| 2| b| Ran2|
+---+-----+-------+