У меня есть 2 .csv
файлы с IP-адресами и именами.
Моя цель - создать выходной файл, в котором перечислены все строки из file_a.csv
, за исключением тех, где ip
уже существуетв file_b.csv
, независимо от того, какое значение имеет столбец name
.
file_a.csv:
ip,name,kind
10.0.0.1,AA,ID
10.0.0.2,AA,ID
10.0.0.3,BB,ID
10.0.0.4,BB,ID
10.0.0.5,CC,ID
10.0.0.6,CC,ID
И file_b.csv:
ip,name,kind
10.0.0.1,AA,ID
10.0.0.3,XX,ID
10.0.0.5,YY,ID
10.0.0.7,ZZ,ID
10.0.0.9,ZZ,ID
Выходной файл для этого примера будет:
ip,name,kind
10.0.0.2,AA,ID
10.0.0.4,BB,ID
10.0.0.6,CC,ID
До сих пор я предполагаю, что цикл с awk мог бы работать, но я не уверен, как выполнить сравнение:
awk -F ',' 'NR==FNR{c[$1]++;next}; <comparison missing>' file_a.csv file_b.csv > new_file.csv
Любые другие команды, которые достигают цели, приветствуются.