Вы можете попробовать найти и заменить следующее:
Find: <url>\s+<loc>(.*?)<\/loc>\s+<lastmod>.*?<\/lastmod>\s+<priority>.*?<\/priority>\s+<\/url>
Replace: $1
Подход этого ответа состоит в том, чтобы полностью сопоставить каждый тег <url>
, а затем заменить его URL-адресом, захваченным в шаблоне, оставив нам только те URL-адреса, которые вы ожидаете.
Демо
Примечание. В целом нежелательно использовать регулярные выражения для анализа содержимого HTML / XML. Скорее, лучше использовать парсер. Вышеупомянутое решение дано для Notepad ++, который не имеет встроенного синтаксического анализатора XML.