У меня есть текстовый файл с разделенными запятыми (точками с запятой) значениями (.csv) и дубликатами.Вот пример:
AA;1
AA;6
DD;8
CC;4
CC;7
CC;2
BB;6
BB;1
AA;3
EE;2
Я хочу сгруппировать последовательные дубликаты в первом столбце, вставив строку в начале <x>
и в конце </x>
каждой группы (или обернуть группыс тегами, как в HTML).Результат должен выглядеть следующим образом:
<x>
AA;1
AA;6
</x>
DD;8
<x>
CC;4
CC;7
CC;2
</x>
<x>
BB;6
BB;1
</x>
AA;3
EE;2
Я думал, что это можно реализовать с помощью Perl Regex или sed.Но я не знаю, как найти первый и / или последний дубликат группы в первом столбце.Может кто-нибудь помочь мне, пожалуйста?