Извлечь текст из класса в HTML, используя CSS язык - PullRequest
0 голосов
/ 27 мая 2020

У меня есть следующий html кусок

    soup = <span class="posting-location go-to-posting">
                                Santa Gertrudes , 
                                <span> Tatuapé, São Paulo</span>
    </span>

Я знаю, что для доступа к «Татуапе, Сан-Паулу» я могу использовать

soup.select_one('span')

Однако как это сделать? Я выбираю "Санта Гертрудес"?

1 Ответ

2 голосов
/ 27 мая 2020

Я использую BeautifulSoup для анализа предоставленного вами HTML.

Затем я перемещаюсь по супу, используя промежутки. После того, как у меня есть целевой элемент, я получаю текст элемента.

soup.span.span.text

или

Это находит все промежутки и выбирает второй.

soup.find_all('span')[1]

У меня есть этот дополнительный код перед вызовом любого из них.

from bs4 import BeautifulSoup

html = "<span class="posting-location go-to-posting">Santa Gertrudes , <span> Tatuapé, São Paulo</span></span>"

soup = BeautifulSoup(html, 'html.parser')
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...