У меня есть html исходный код, который я хочу отфильтровать по одной или нескольким ссылкам и сохранить остальные.
Я настроил свой фильтр с "*" в качестве подстановочного знака:
<a*>Link1</a>‚ <a*>Link2</a>‚ or <a*>Link3</a>
<a*>A bad link*</a>
some text* <a*>update*</a>
other text right before link <a*>click here</a>
Я бы хотел отфильтровать каждый экземпляр ссылки из исходного кода html, используя python.Я в порядке с загрузкой списка в массив.Мне нужна помощь с фильтром.Каждый разрыв строки будет означать отдельный фильтр, и я хочу только удалить ссылку (и), а не текст
Я все еще очень плохо знаком с python и regex / beautifulsoup.Даже если бы вы указали мне правильное направление, это было бы очень признательно.