Сравните два больших файла CSV и сделайте третий из разницы - PullRequest
0 голосов
/ 09 ноября 2018

У меня проблема с тем, что мне нужно сравнить два больших файла CSV (примерно от 5 до 8 ГБ) и сделать третий файл CSV из их различий. Любой указатель предложения для поддерживаемых библиотек для той же или любой ссылки для начала

например,

File 1.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  1|    a|   Ran1|
|  2|    b|   Ran2|
+---+-----+-------+

File 2.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  3|    c|   Ran3|
|  2|    b|   Ran2|
+---+-----+-------+

Schema of both file is same

Result - file 3.csv
File 2.csv

+---+------+------+
|ID |value1|value2|
+---+------+------+
|  2|    b|   Ran2|
+---+-----+-------+
...