Как исключить внутренние теги с BeautifulSoup - PullRequest
0 голосов
/ 05 октября 2019

Привет, я сейчас пытаюсь разобрать сайт, и я почти закончила, но есть небольшая проблема. Я хочу исключить внутренние теги из HTML-кода

<span class="moto-color5_5">
  <strong>Text 1 </strong>
  <span style="font-size:8px;">Text 2</span>
</span>

Я пытался использовать ... find("span", "moto-color5_5"), но это возвращает

Текст 1 Текст 2 вместо того, чтобы только возвращать Текст 1

Любойпредложения?

sincierly:)

1 Ответ

0 голосов
/ 05 октября 2019

Исключение внутренних тегов также исключит Text 1, поскольку он находится во внутреннем теге <strong>.

Однако вы можете найти strong внутри вашего текущего супа:

html = """<span class="moto-color5_5">
  <strong>Text 1 </strong>
  <span style="font-size:8px;">Text 2</span>
</span>
"""
soup = BeautifulSoup(html)
result = soup.find("span", "moto-color5_5").find('strong')
print(result.text) # Text 1
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...