У меня есть плоский файл , который состоит из следующей структуры:
A1 B1 C1 D1 E1 F1 G1
A2 B2 C2 D2 E2 F2 G2
A3 B3 C3 D3 E3 F3 G3
Этот файл содержит около 1 миллион строк .
Я хотел бы создать следующую статистику:
- Количество строк в файле.
- Количество уникальных записей в конкретной строке (например, B).
- Сортировка по строке F и создание файла, содержащего верхних n записей в этой строке .
Как лучше всего это сделатьделать этот анализ?В настоящее время я использую Mac OSX , поэтому было бы предпочтительным решение для Linux / Mac.