Я использую команду awk для фильтрации дублирующихся строк, мне нравится, что она быстрая и чистая.Однако мне нужно, чтобы он игнорировал строки, которые содержат только (и только - потому что некоторые строки содержат знаки + и другие вещи, и я хочу, чтобы они все еще проверялись на дублирование), плюс, то есть +
Я могу сделать этоиспользуя дополнительные строки кода и некоторые временные файлы, но .. Как я могу отредактировать эту однострочную команду, чтобы сделать это?так что я могу держать его в чистоте и быстро.
Текущий код фильтрует любую строку, которая является дубликатом другой строки в любом месте другого файла, это здорово, но может игнорировать + только строки
Это код:
awk 'NR==FNR{a[$0]=1;next}!a[$0]' file2 file1 > FilteredFile
file1:
1234
+
adcs
abba
+
542221
+
jabba
file2:
jingle
1234
+
haad
+
rigor
abba
wiggle
+
542221
jabba
вывод:
jingle
+
haad
+
rigor
+
wiggle