В настоящее время у меня есть список URL-адресов и я хочу подсчитать, сколько раз определенные URL-адреса встречаются в файле. Но перед этим я хочу удалить все URL-адреса, которые стоят друг за другом, без прерывания другой строкой, которая не совпадает, НО позволять одному URL-адресу 1 оставаться. Я думал, что это может быть с регулярным выражением.
Например, это происходит в файле результатов.
www.website1.com
www.website2.com
www.website3.com
www.website3.com !
www.website3.com !
www.website3.com !
www.website1.com
www.website3.com
www.website2.com
Конечные результаты должны выглядеть следующим образом:
www.website1.com
www.website2.com
www.website3.com
www.website1.com
www.website3.com
www.website2.com
Я хочу удалить 3 из 4 первых результатов URL-адреса "website3" (я поставил позади них! это.