Как игнорировать теги на Python Beautifulsoup4 - PullRequest
1 голос
/ 22 сентября 2019

Я работаю над новым проектом, и у меня есть некоторые проблемы.

Моя проблема такова.

<div class="news">
      <p class="breaking">  </p>
      ...
<p> i need to pull here. </p>

, но class = "Breaking" не позволяет мне делатьЭто.Я хочу игнорировать класс "взлом" и тянуть <p>.

1 Ответ

0 голосов
/ 22 сентября 2019

Может быть, class='' будет делать с find_all или findAll:

from bs4 import BeautifulSoup

html = """
<div class="news">
      <p class="breaking">  </p>
      ...
<p> i need to pull here. </p>

"""

soup = BeautifulSoup(html, 'html.parser')

print(soup.find_all('p', class_=''))
print(soup.findAll(True, {'class': ''}))

Выход

[<p> i need to pull here. </p>]
[<p> i need to pull here. </p>]
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...