У меня есть два файла:
candidates.csv
:
id,value
1,123
4,1
2,5
50,5
blacklist.csv
:
1
2
5
3
10
Я хочу удалить все строки из candidates.csv
, в котором первый столбец (id
) имеет значение, содержащееся в blacklist.csv
.id
всегда числовой.В этом случае я хотел бы, чтобы мой вывод выглядел так:
id,value
4,1
50,5
Пока что мой скрипт для идентификации дублирующих строк выглядит так:
cat candidates.csv | cut -d \, -f 1 | grep -f blacklist.csv -w
Это дает мнеoutput
1
2
Теперь мне как-то нужно передать эту информацию обратно в sed
/ awk
/ gawk
/ ..., чтобы удалить дубликаты, но я не знаю как.Любые идеи, как я могу продолжить отсюда?Или вообще есть лучшее решение?Мое единственное ограничение - это запуск в bash.