У меня длинный список строк с множеством подобных ситуаций, строки с одинаковым вторым словом (вторая строка после пробела), но остальное отличается. Мне нужно сохранить только одну строку с уникальной второй строкой. Должно работать только для строк с одним и тем же вторым словом, которые всегда являются последовательными. Например, у меня есть строки:
lineA 12345<br/>lineB 12345<br/>lineC 12345<br/>lineD 788878<br/>lineE 110881<br/>lineF 110881<br/>lineG 110881<br/>lineH 287778<br/>lineJ 251287<br/>lineK 242424<br/>lineL 242424<br/>lineM 242424
для этого результата
lineA 12345
lineD 788878
lineE 110881
lineH 287778
lineJ 251287
lineK 242424
Итак, если второе слово в строке соответствует, удалите все строки, кроме одной. Я пытался создать регулярное выражение, но оно удаляется только в случае совпадения первого слова. Я не могу понять, как сделать это для второго слова после пробела, как в примере.
^(\S++).*\K(?:\R\1(?:\h.*|$))+