Самый простой способ - напечатать первую строку (ваш начальный заголовок), а затем распечатать каждую оставшуюся строку, которая начинается с числа, используя awk
, например,
awk 'FNR == 1; FNR > 1 && /^[0-9]/' file
Где
FNR == 1
использует операцию печати по умолчанию для вывода первой строки; FNR > 1 && /^[0-9]/
для всех номеров записей файлов (строк) больше единицы и начинается с цифры,вывод с использованием операции печати по умолчанию.
Пример использования / вывода
С вашим примером в file
вы получите:
$ awk 'FNR == 1; FNR > 1 && /^[0-9]/' file
EMAIL_MD5_HASH_
12345
45678
56789
65478
65738
64738
92827
35658
08978
34546
98765
89076
09875
12564
09876
Дайте мне знать, если вы этого хотели. Пока это простой текстовый файл с '\n'
окончаниями строк, awk
должен обрабатывать 8,3 млн. Записей всего за секунду.