Как извлечь промежуточный код с помощью BeautifulSoup? - PullRequest
0 голосов
/ 19 октября 2019

Я хотел бы извлечь текст «ЭТОТ ТЕКСТ, КОТОРЫЙ Я ХОЧУ ЭКСТРАКТИРОВАТЬ» из фрагмента ниже. У кого-нибудь есть предложения? Спасибо!

<span class="cw-type__h2 Ingredients-title">Ingredients</span>
<p>
                                THIS IS THE TEXT I WANT TO EXTRACT</p>

Ответы [ 2 ]

0 голосов
/ 19 октября 2019

Если предположить, что, скорее всего, больше html, я бы использовал класс предшествующего span с смежным селекторным комбинатором и p для нацеливания на соответствующий тег p

from bs4 import BeautifulSoup as bs

html = '''
<span class="cw-type__h2 Ingredients-title">Ingredients</span>
<p>
                                THIS IS THE TEXT I WANT TO EXTRACT</p>
                                '''
soup = bs(html, 'lxml')
print(soup.select_one('.Ingredients-title + p').text.strip())
0 голосов
/ 19 октября 2019
from bs4 import BeautifulSoup
html = """<span class="cw-type__h2 Ingredients-title">Ingredients</span><p>THIS IS THE TEXT I WANT TO EXTRACT</p>"""
soup = BeautifulSoup(html,'lxml')
print(soup.p.text)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...