Красивые атрибуты тега извлечения Супа, затем find_all с несколькими атрибутами - PullRequest
0 голосов
/ 15 мая 2018

Я пытаюсь извлечь ту же информацию, которая появляется много раз на одной странице.Я могу найти тег, к которому он подходит, который выглядит следующим образом:

<div class="title" style="visibility: visible">

Из этого я хотел бы извлечь:

 class="title"

И

style="visibility: visible"

Затем выполните:

find_all('div),{'class':'title,'style''visibility: visible'}

Это будет происходить во многих случаях, поэтому я не могу жестко закодировать это.Иногда у тега будет класс, иногда класс и стиль .... иногда больше ....

Возможно ли это?

Действительно ценю любое направление по этому вопросу.

Большое спасибо,

1 Ответ

0 голосов
/ 16 мая 2018

Кроме того, вы можете использовать метод find_all, если вам нужно более одного div в содержимом


код:

from bs4 import BeautifulSoup
import json
data = """<div class="title" style="visibility: visible"> </div>"""
soup = BeautifulSoup(data, 'html.parser') #parse content to BeautifulSoup Module
div_content = dict(soup.find("div").attrs)
print("div_content   :  {0}".format(div_content)) #div content
print("style_content :  {0}".format(div_content.get("style"))) # style attribute
print("class_content :  {0}".format(div_content.get("class")[0])) # class attribute

вывод:

div_content   :  {u'style': u'visibility: visible', u'class': [u'title']}
style_content :  visibility: visible
class_content :  title
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...