У меня есть большой файл журнала, содержащий строки для конкретной задачи следующим образом:
[info] My task : 123
[info] Other task : 111
[info] My task : 456
[info] My task : 456
[info] My task : 789
Я хочу подсчитать количество зарегистрированных "My task"
уникальных.Которая в этом случае должна быть 3.
Я использовал эти две команды, которые, на мой взгляд, должны давать одинаковые и правильные результаты:
grep 'My Task :' | uniq | wc -l
grep -E 'My Task :' | sort --unique | grep -cE 'My Task :'
Две команды дают одинаковые результатына маленьких тестовых файлах я создаю, но разные результаты на большом лог-файле на сервере.Я не могу понять почему.Точнее, первая команда дает счет ~ 33k, а вторая дает ~ 15k.Какая команда из двух, если таковая есть, правильна?И что я в идеале должен делать?