У меня есть набор html файлов. Мне нужно удалить ссылки из сегмента "ul / li", но другие ссылки и сегменты "ul / li" должны остаться.
Я использую BS для этого.
<p>
<a href="link" class="story body__link">link</a>
</p>
<ul class="story-body__unordered-list">
<li class="story-body__list-item">
<a href="link" class="story-body__link">link</a>
</li>
</ul>
<ul class="story-body__unordered-list">
<li class="story-body__list-item">
text
</li>
</ul>
Я использую python BS для этой задачи. И мне удалось сделать эту задачу с помощью этого кода, но это не идеально. Мой вопрос, есть ли лучшее и более чистое решение для этого?
soup = BeautifulSoup(page, 'html.parser')
for i in soup.find_all('li', attrs={"story-body__list-item"}):
x = str(i.next_element)
if x.startswith( '<a' ) == True:
i.decompose()