Я пытаюсь удалить строки, которые идентичны от начала до определенной строки в строке и обрезать все после этой строки.
Пример строки:
http://waterfountain.common.com/12443
http://waterfountain.common.com/243
http://waterfountain.common.com/243
http://glass.common.com/clear
http://glass.common.com/clear
http://1room.common.com/closet/empty
В этом случае я бы хотел сравнить все: от linestart до «common.com», удалить все дубликаты и дополнительно обрезать все после «common.com» или «/".
».
Желаемый конечный результат будет выглядеть так: (с или без "/" в конце)
http://waterfountain.common.com/
http://glass.common.com/
Я нашел частичные решения, но я не знаю, как изменить / объединить их с моими потребностями.
Например, удалить строки, которые полностью идентичны:
^(.*?)$\s+?^(?=.*^\1$)
Edit:
Я попробовал решение «Четвертая птица», и хотя оно работает для случая, о котором я говорил, некоторые тесты показали, что бывают случаи, когда оно не удается. (Случаи, которые я забыл упомянуть.)
Возможно, что число появляется после начального "//", например,
http://2eyes.common.com/
Также возможно, что после третьего знака "/" есть буквы, например,
http://snow.common.com/first/