что такое сценарий оболочки для чтения и анализа файла журнала, например, для получения всех адресов электронной почты в файле журнала? - PullRequest
0 голосов
/ 11 августа 2011

Файл журнала содержит много адресов электронной почты, и мне нужно написать сценарий оболочки, чтобы проанализировать файл журнала и получить все адреса электронной почты. Размер файла журнала составляет 1 ГБ, а оперативная память моего vps-сервера составляет всего 512 м, поэтому я хочу принять во внимание производительность. как я могу это сделать?

1 Ответ

4 голосов
/ 11 августа 2011

если каждая строка начинается с электронной почты, вы можете использовать эти команды.Первый выбирает первое «слово» файла, а второй дает уникальные значения:

cut -f 1 -d ' ' LOGFILE.txt | sort -u
...