У меня есть большой файл, скажем file1.log
, который выглядит следующим образом:
1322 a@gmail.com
2411 b@yahoo.com
и файл меньшего размера, скажем file2.log
, который выглядит следующим образом:
a@gmail.com
c@yahoo.com
Фактически, file1.log
содержит около 6500000 строк, а file2.log
содержит около 140000.
Я хочу найти все строки в file2.log
, которые не отображаются в file1.log
. Я написал эту команду awk:
awk 'NR==FNR{c[$2]++} NR!=FNR && c[$1]==0 {print $0}' file1.log file2.log > result.log'
через полчаса или около того я обнаружил, что команда все еще выполняется, и less result.log
показывает, что result.log
пусто. Мне интересно, могу ли я что-то сделать, чтобы сделать работу быстрее?