Как удалить все живые ссылки, кроме «фиктивного» якорного текста с помощью регулярных выражений - PullRequest
0 голосов
/ 24 марта 2020

вход:

Lorem <a href="random1.com">Ipsum</a> is simply <a href="random2.com">dummy</a> text of the <a href="random3.com">printing</a> and typesetting industry.

Требуемый вывод:

Lorem Ipsum is simply <a href="random2.com">dummy</a> text of the printing and typesetting industry.

Как удалить все живые ссылки, кроме "фиктивного" текста привязки с регулярным выражением?

Спасибо.

1 Ответ

1 голос
/ 24 марта 2020

С python:

import re
str = 'Lorem <a href="random1.com">Ipsum</a> is simply <a href="random2.com">dummy</a> text of the <a href="random3.com">printing</a> and typesetting industry.'
print(re.sub(r'<a href=[^>]+>(?!dummy)(.*?)</a>', r'\1', str))

С perl:

$_ = 'Lorem <a href="random1.com">Ipsum</a> is simply <a href="random2.com">dummy</a> text of the <a href="random3.com">printing</a> and typesetting industry.';
s#<a href=[^>]+>(?!dummy)(.*?)</a>#$1#g;
print "$_\n";

Результат:

Lorem Ipsum is simply <a href="random2.com">dummy</a> text of the printing and typesetting industry.
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...