Я пытаюсь отфильтровать файл, выбрав первую и последнюю строку заданной переменной в текстовом файле с разделителями табуляции с помощью AWK.
Файл с разделителями табуляции выглядит следующим образом:
1 apple 30
2 apple 35
3 apple 36
4 apple 20
5 pear 10
6 pear 30
7 pear 45
8 orange 16
END
и я пытаюсь обработать это с помощью awk, чтобы печатать только первые и последние строки каждой переменной в $ 2 (столбец с фруктами в этом примере)
Файл, который у меня есть, имеет длину ~ 35000 строк и содержит 3000 уникальных переменных в столбце, который я хочу использовать в качестве фильтра (поэтому в приведенном выше примере col2)
Я думал, что подход будет заключаться в создании массива уникальных значений col2 (яблоко, груша, апельсин), а затем с помощью этого массива извлечь первые и последние значения из файла большего размера ... но некоторые советуют по номенклатуре необходимо выбрать первую и последнюю строку для каждой индексированной переменной будет принята с благодарностью. :)
Файл INPUT, указанный выше, ожидаемый результат будет
1 apple 30
4 apple 20
5 pear 10
7 pear 45
8 orange 16
выходные данные должны включать в себя только те, которые имеют только одну запись (в данном случае оранжевый)