Как получить цитируемый текст в элементе - PullRequest
0 голосов
/ 04 марта 2020

Я пытаюсь получить at Broadway Pilates от элемента ниже. Я использую BeautifulSoup.

<span data-component="LocalizableMessage"> Essential Reformer </span> “at Broadway Pilates” 

Мой текущий код:

try:
    studio_name = classses_soup.find(
        'span', {'data-component': 'LocalizableMessage'}).text

Мой код получает только первую часть Essential Reformer. Что мне нужно сделать, чтобы получить вторую часть at Broadway Pilates?

Желательно (но не обязательно) просто Broadway Pilates, поэтому без at.

Спасибо!

1 Ответ

0 голосов
/ 04 марта 2020
from bs4 import BeautifulSoup

html = """<span data-component="LocalizableMessage"> Essential Reformer </span> “at Broadway Pilates” """

soup = BeautifulSoup(html, 'html.parser')

for item in soup.findAll("span", {'data-component': 'LocalizableMessage'}):
    print(item.next_sibling.string.strip()[4:-1])

Выход:

Broadway Pilates
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...