Я пытаюсь найти метод, который придерживается метода find
, так как он наиболее удобный и адаптируемый. Проблема в том, что комментарии HTML портят движок. Удаление комментариев вручную было бы полезно.
from bs4 import BeautifulSoup, Comment
bs = BeautifulSoup(
"""
<a class="accordion-item__link" href="/identity-checking/individual"><!-- react-text: 178 -->Australia<!-- /react-text --></a>
""",
"lxml"
)
# find all HTML comments and remove
comments = bs.findAll(text=lambda text:isinstance(text, Comment))
[comment.extract() for comment in comments]
r = bs.find('a', text='Australia')
print(r)
# <a class="accordion-item__link" href="/identity-checking/individual">Australia</a>
Отсюда появился метод удаления комментариев Как я могу удалить теги комментариев из HTML, используя BeautifulSoup?
Если комментарии должны быть сохранены, вы можете поработать над копией супа.