У меня есть два файла, и я хочу проверить, существует ли каждая строка в этом файле. Однако иногда порядок слов после второго слова в каждой строке отличается. Это нормально, потому что меня интересуют только пропущенные / дополнительные слова после первых двух слов / столбцов.
file_A:
foobar A a ab c bd hd
bar B a c jd sm sldkjn
baz C boo abd
file_B:
foobar A a c bd hd ab
baz C abd boo
bar B c a jd sm sldkjn
В приведенном выше примере эти два файла хороши, исходя из моих критериев.
Сначала я попробовал
$ sort -u file_A > outA
$ sort -u file_B > outB
$ diff outA outB
Таким образом, порядок строк не учитывается.
Однако он учитывает порядок слов в каждой строке.
Как я могу игнорировать порядок слов в каждой строке после второго столбца?