Обрезать текст из очищенного элемента - Python / bs4 - PullRequest
2 голосов
/ 16 апреля 2020

Я использую soup.find('div', class_='listing-agent').get_text(), чтобы получить результат Listed by Joe Smith • ACME CO. Я пытаюсь просто получить Joe Smith. Как я могу обрезать текст, чтобы просто получить имя?

<div class="listing-agent">
  <span>
    "Listed by "
    <span>Joe Smith</span>
    <span>
    <span class="font-dot">•</span>
    <!-- -->
    "ACME CO"
    <!-- -->
  </span>
</div>

Ответы [ 2 ]

0 голосов
/ 16 апреля 2020

Если вы попробуете это:

n = soup.find('div', class_='listing-agent')

name = n.find_all('span')[1].text

print(name)

Вывод будет: Joe Smith

0 голосов
/ 16 апреля 2020

Пусть:

a = soup.find('div', class_='listing-agent')

name = a.find_all('span')[0].find_all('span')[0].text # parsing the span

Это дает:

>>>name
Joe Smith
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...