Regex: Найти теги, которые не содержат слово, и вставить это слово в REPLACE - PullRequest
0 голосов
/ 27 сентября 2019

У меня много ссылок, как эта:

<a href="love-management.html" title="See this" class="external" rel="category tag">

, а эта

<a href="https://abcd.com/love-management.html" title="See this" class="external" rel="category tag">

Извлечь из: <td class="text_dreapta">On Feb 20, 2012, in <a href="love-management.html" title="See this" class="external" rel="category tag">Management</a>

Теперь о первом случае.Мне нужно найти все те теги, которые не содержат https://, и вставить их, чтобы вставить в них.

Итак, по сути:

<a href="love-management.html"

станет

<a href="https://abcd.com/love-management.html"

Но будьте осторожны, чтобы не повторять https://, например <a href="https://https://abcd.com/love-management.html"

1 Ответ

2 голосов
/ 27 сентября 2019

Вы можете использовать отрицательный прогноз, чтобы утверждать, что еще нет https://,, поэтому ваш Regex будет выглядеть как (<a .*?href=")(?!https://)(.+?").

Тогда это просто случай замены первой группой, за которой следуетhttps: // сопровождается второй группой: $1https://$2.

Вы можете попробовать здесь .

...