У меня есть абзац BeautifulSoup в виде строки. Я хочу заменить вхождения p (открытие) и / p (закрытие) теги в строке с помощью регулярных выражений, потому что есть экземпляры типа
<p class="section-para">We would be happy to hear from you, Please
fill in the form below or mail us your requirements on<br/><span
class="text-red">contact@xyz.com</span></p>
Но я не могу использовать общий
^< *>$
, потому что я хочу теги strong , b и h1, h1..h6 для различных целей.
Я знаю только основы RegEx, но не знаю, как их создать и использовать.
Может ли кто-нибудь помочь мне сделать «включение», «исключение» (если есть). Как я могу сделать один для этой проблемы и как я могу заменить на простой ''
def formatting(string):
this=['<h1>','</h1>','<h2>','</h2>','<h3>','</h3>','<h4>','</h4>','<h5>','</h5>','<h6>','</h6>','<b>','</b>','<strong>','</strong>']
with_this=['\nh1 Tag:','\n','\nh2 Tag:','\n''\nh3 Tag:','\n''\nh4 Tag:','\n''\nh5 Tag:','\n''\nh6 Tag:','\n','\Bold:','\n''\nBold:','\n']
for i in range(len(this)):
if this[i] in string:
string=string.replace(this[i],with_this[i])
return(string)
Я использовал функции замены строк для тегов h1,2 ... 6 . Любая помощь будет оценена.