Скажем, есть два файла File1.txt и File2.txt, каждый файл содержит адреса электронной почты.Мне нужно удалить все адреса электронной почты из file1.txt, если они присутствуют в file2.txt> = 2 раза.
Мне нужно сделать это, чтобы убедиться, что кто-то не получил по электронной почте более двух раз.
Я видел, как другие люди использовали comm или diff для похожих вопросов, но я не уверен, что делать в этом случае.
Пример
File1.txt:
abc@gmail.com
def@gmail.com
ghi@gmai.com
jkl@gmail.com
File2.txt:
abc@gmail.com
abc@gmail.com
acb@gmai.com
ghi@gmai.com
jkl@gmail.com
Вывод (файлы из файла file1, которые не находятся в file2.txt более 2 раз)
File3.txt:
def@gmail.com
ghi@gmai.com
jkl@gmail.com
Также предположим, что этот файл имеет размер 100 000+записи, так что это не может быть сделано вручную