У меня есть файл TSV, который содержит поисковые фразы из разных регионов мира. Фразы сгруппированы по регионам и отсортированы по убыванию частоты.
В третьем столбце указан регион, в котором был выполнен веб-поиск (например, US_VA == Вирджиния, США)
Второй столбец представляет фактическую поисковую фразу.
В первом столбце указано количество поисков фразы в этом регионе.
10 shoes US_MA
9 boot US_MA
4 coat US_MA
12 hat US_TX
20 bathing suit US_CA
18 shorts US_CA
15 t shirt US_CA
10 sandals US_CA
В скрипте bash я хотел бы урезать файл так, чтобы он содержал только два самых популярных запроса для каждого региона
например, вывод должен выглядеть примерно так:
10 shoes US_MA
9 boot US_MA
12 hat US_TX
20 bathing suit US_CA
18 shorts US_CA
Я полагаю, что решение включает в себя несколько awk, но я не могу понять это.