Недавно я попытался сделать регулярное выражение для удаления строк, которые стоят друг за другом, не прерываясь другой строкой, и затем оставил только одну строку. Моя работа на данный момент: https://regex101.com/r/Cs0bmY/7. Он должен работать со всеми возможными URL, которые, возможно, не имеют www. перед ними или другим окончанием, как .com или .nl и т. д.
Строки (список URL) выглядит так:
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
operator.livrareflori.md
amazon.de
fonts.gstatic.com
fonts.gstatic.com
fonts.gstatic.com
erovoyeurism.net
tugtechnologyandbusiness.com
Конечный результат должен выглядеть следующим образом:
operator.livrareflori.md
amazon.de
fonts.gstatic.com
erovoyeurism.net
tugtechnologyandbusiness.com
Вы можете видеть, что повторяющиеся строки, которые не прерываются другой строкой, пропадают и остается только 1 результат.