Используйте утилиты оболочки для эквивалента группы SQL в файле CSV - PullRequest
2 голосов
/ 24 сентября 2010

У меня есть CSV-файл, где самый левый столбец содержит поле идентификатора. Есть ли умный способ использовать любые служебные программы, такие как sed, чтобы найти идентификаторы, которые используются более одного раза?

1 Ответ

5 голосов
/ 24 сентября 2010

Если вам нужны только идентификаторы, тогда вы можете попробовать

cut -d "," -f $NUM | sort -n | uniq -d

, где $NUM - номер поля, содержащего идентификатор.Команда cut извлечет список идентификаторов, а команда uniq покажет только те, которые дублированы.

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...