У меня есть файл (с разделителями табуляции) с 6 столбцами (здесь я показал 2 столбца для простоты)
46_#1 A
47_#1 B
49_#1 C
51_#1 D
51_#1 E
Я хочу подсчитать дубликаты в первом столбце (только счетчик без удаления) и сохранить счетчик в следующем столбце. Таким образом, вывод должен быть -
46_#1 1 A
47_#1 1 B
49_#1 1 C
51_#1 2 D
51_#1 2 E
Я использовал команду linux-
uniq -c file
но это займет целую строку (не 1-й столбец), тогда я использовал
uniq -c -w5 file
Но количество слов в первом столбце может варьироваться.
Может кто-нибудь помочь, пожалуйста?
PS - У меня очень большой файл (около 1 ГБ).