У меня есть файл со следующими шаблонами.
NO_MATCH
NO_MATCH||NO_MATCH
NO_MATCH||NO_MATCH||NO_MATCH
NO_MATCH||NO_MATCH||NO_MATCH||NO_MATCH
Они должны точно соответствовать 5-му столбцу целевого CSV. Я пробовал:
awk 'NR==FNR{a[$0]=$0; next;} NR>FNR{if($5==a[$0])print $0}' pattern.csv input.csv > final_out.csv
Но ||
в файле шаблонов приводит к плохим совпадениям. 5-й столбец в целевой CSV выглядит примерно так:
"AAAA||AAAA"
"BBBB||BBBB"
"NO_MATCH"
"NO_MATCH||NO_MATCH||NO_MATCH"
"NO_MATCH||BBBB"
Мне нужно извлечь 3-ю и 4-ю строки.
Редактировать: мне нужно точное совпадение, такое как строки 3 и 4. Надеюсь, это решит проблему. Столбцы в csv имеют двойные кавычки, как показано, и кавычки вокруг пятого столбца должны быть удалены.