Question

Я ищу решение, использующее Python и BeautifulSoup, чтобы найти элемент, основанный на внутреннем тексте.Например:

<div> <b>Ignore this text</b>Find based on this text </div>

Как мне найти этот div?Спасибо за помощь!

Rakesh · Answer 1 · 22 мая 2018

Вы можете использовать .find с аргументом text, а затем использовать findParent для родительского элемента.

Пример:

from bs4 import BeautifulSoup
s="""<div> <b>Ignore this text</b>Find based on this text </div>"""
soup = BeautifulSoup(s, 'html.parser')
t = soup.find(text="Find based on this text ") 
print(t.findParent())

Выход:

<div> <b>Ignore this text</b>Find based on this text </div>

Druta Ruslan · Answer 2 · 22 мая 2018

попробуйте, это как пример, но работает

from bs4 import BeautifulSoup
html="""
<div> <b>Ignore this text</b>Find based on this text </div>
"""

soup = BeautifulSoup(html, 'lxml')                                                                                                                                                

s = soup.find('div')

for child in s.find_all('b'):
    child.decompose()

print(s.get_text())

Вывод

 Find based on this text

Как найти элемент на основе текста, игнорировать дочерние теги в beautifulsoup

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как найти элемент на основе текста, игнорировать дочерние теги в beautifulsoup

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов