Я занимаюсь сравнением 2 больших несортированных .csv
файлов на основе столбцов 1 и 3. Каждый файл содержит около 200 тыс. Записей.Для вывода мне нужно знать, какие записи на основе столбцов 1 и 3 существуют в первом файле, но не во втором файле.Файлы заключаются в кавычки, разделенные запятыми.Столбец 3 должен игнорировать регистр при сравнении.
Файл примера 1:
"id", "name", "email", "country"
"1233", "jake", "jake@mailinator.com", "USA"
"2345", "alison", "Alison@mailinator.com", "Canada"
"3456", "jacob", "jacob@mailinator.com", "USA"
"5678", "natalia", "natalia@mailinator.com", "USA"
Файл 2
"id", "name", "email", "country"
"2345", "alison", "alison@mailinator.com", "Canada"
"3456", "jacob", "jacob@mailinator.com", "USA"
"5690", "lina", "lina@mailinator.com", "Canada"
требуемый файл вывода
"5678", "natalia", "natalia@mailinator.com", "USA"
Примеры кода будут очень полезны.