Файл 1:
1075908|2178412|brown_eyeshorty@att.net|Claude|Desmangles
175908|2178412|naim.kazi@webtv.net|Naim|Kazi
175972|212946872418|gil_maynard@hotmail.com|Munster|Herman
175972|212946872418|meghanj4@lycos.com|Meghan|Judge
175972|212946872418|quenchia@gmail.com|Anna|Balint
176046|255875|keion@netscape.net|Charlene|Johnson
176046|255875|keion112@netscape.net|Charlene|Johnson
176086|2480881|lourdsneil@gmail.com|Lourds|Herman
Файл 2:
89129090|Sadiq|Islam
212946872418|Anna|Balint
255875|Charlene|Johnson
89234902|Bob|Brown
09123789|Fabio|Vanetti
Я хотел бы извлечь строки, в которых ВСЕ значения совпадают на следующей основе:
- Столбец 2 в файле 1 соответствует столбцу 1 в файле 2.
- Столбец 4 в файле 1 соответствует столбцу 2 в файле 2.
- Столбец 5 в файле 1 соответствует столбцу 3 в файле2.
Ожидаемый вывод для примера:
175972|212946872418|quenchia@gmail.com|Anna|Balint
176046|255875|keion@netscape.net|Charlene|Johnson
176046|255875|keion112@netscape.net|Charlene|Johnson
Оба входа, с которыми я работаю, очень большие (11 ГБ и 3 ГБ соответственно).
Единственный возможный (грязный) обходной путь, о котором я могу подумать, - это объединить значения, которые нужно объединить, в один дополнительный столбец и затем использовать Join (я очень новичок в этом).