Как найти последовательные дубликаты в текстовом столбце и обернуть найденные группы тегами - PullRequest
0 голосов
/ 27 ноября 2018

У меня есть текстовый файл с разделенными запятыми (точками с запятой) значениями (.csv) и дубликатами.Вот пример:

AA;1
AA;6
DD;8
CC;4
CC;7
CC;2
BB;6
BB;1
AA;3
EE;2  

Я хочу сгруппировать последовательные дубликаты в первом столбце, вставив строку в начале <x> и в конце </x> каждой группы (или обернуть группыс тегами, как в HTML).Результат должен выглядеть следующим образом:

<x>
AA;1
AA;6
</x>
DD;8
<x>
CC;4
CC;7
CC;2
</x>
<x>
BB;6
BB;1
</x>
AA;3
EE;2  

Я думал, что это можно реализовать с помощью Perl Regex или sed.Но я не знаю, как найти первый и / или последний дубликат группы в первом столбце.Может кто-нибудь помочь мне, пожалуйста?

...