У меня есть файл с разделением табуляцией, который выглядит следующим образом:
A 1234
A 123245
A 4546
A 1234
B 24234
B 4545
C 1234
C 1234
Output:
A 3
B 2
C 1
В основном мне нужно количество уникальных значений, которые принадлежат первому столбцу, все в одном коммандос с конвейерами. Как видите, могут быть дубликаты типа «A 1234». У меня были идеи с awk или cut, но, похоже, ни один из них не работает. Они просто распечатывают все уникальные пары, а мне нужно подсчет уникальных значений из второго столбца с учетом значения в первом.
awk -F " "'{print $1}' file.tsv | uniq -c
cut -d' ' -f1,2 file.tsv | sort | uniq -ci
Я буду очень признателен за вашу помощь! Заранее спасибо.