Эй, ребята, интересно, кто-нибудь может помочь с этой маленькой дилеммой
Попытка удалить строки из текстового файла системного журнала, которые имеют повторяющиеся строки
10 марта 06:51:11 [http-8080-1] ИНФОРМАЦИЯ com.MYCOMPANY.webservices.userservice.web.UserServiceController [u: 2533274802474744 | 360] Авторизовать [platformI $ tformIdAndOs = 2533274802474744 | 360 | пользовательский регион 360]
затем на несколько строк вниз
10 марта 06:52:03 [http-8080-1] ИНФОРМАЦИЯ com.MYCOMPANY.webservices.userservice.web.UserServiceController [u: 2533274802474744 | 360] Авторизовать [platformI $ tformIdAndOs = 2533274802474744 | 360 | пользовательский регион 360
получил то же самое с точки зрения числа u: но проблема в том, что мне нужно удалить дубликаты и просто оставить один, и файл содержит несколько дубликатов с разными номерами u: и его длина составляет 14 000 строк.
Может кто-нибудь сказать мне, могу ли я использовать awk? СЭД? или сортировать что то подобное? удаление строк с определенной строкой, которая является дубликатом.
Мне, в принципе, нужно дедуплицировать, но проблема в том, что только одна маленькая часть строки - это индикатор.
Любая помощь приветствуется! спасибо