Позвольте мне начать с того, что я не хочу печатать только дубликаты строк и не хочу их удалять.
Я пытаюсь использовать grep с файлом шаблона для анализа большого файла данных.
Файл шаблона, например, может выглядеть так:
1243
1234
1234
1234
1354
1356
1356
1677
и т.д.. с большим количеством одинарных и повторяющихся записей.
Файл входных данных может выглядеть следующим образом:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
ttttt 1555 bbbbbb
ppppp 1354 pppppp
yyyyy 3333 zzzzzz
qqqqq 1677 eeeeee
iiiii 4444 iiiiii
и т.д.. для 27000 строк.
когда я использую
grep -f 'Patternfile.txt' 'Inputfile.txt' > 'Outputfile.txt'
Я получаю выходной файл, похожий на этот:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
ppppp 1354 pppppp
как я могу заставить его также сообщать о дубликатах, чтобы я получил что-то вроде этого?:
aatta 1243 qqqqqq
yyyyy 1234 vvvvvv
yyyyy 1234 vvvvvv
yyyyy 1234 vvvvvv
ppppp 1354 pppppp
qqqqq 1677 zzzzzz
Кроме того, я также хотел бы напечатать пустую строку, если запрос в файле шаблона не соответствует подстроке во входном файле.
Спасибо!