Question

Я пытаюсь извлечь ту же информацию, которая появляется много раз на одной странице.Я могу найти тег, к которому он подходит, который выглядит следующим образом:

<div class="title" style="visibility: visible">

Из этого я хотел бы извлечь:

 class="title"

И

style="visibility: visible"

Затем выполните:

find_all('div),{'class':'title,'style''visibility: visible'}

Это будет происходить во многих случаях, поэтому я не могу жестко закодировать это.Иногда у тега будет класс, иногда класс и стиль .... иногда больше ....

Возможно ли это?

Действительно ценю любое направление по этому вопросу.

Большое спасибо,

Rachit kapadia · Answer 1 · 16 мая 2018

Кроме того, вы можете использовать метод find_all, если вам нужно более одного div в содержимом

код:

from bs4 import BeautifulSoup
import json
data = """<div class="title" style="visibility: visible"> </div>"""
soup = BeautifulSoup(data, 'html.parser') #parse content to BeautifulSoup Module
div_content = dict(soup.find("div").attrs)
print("div_content   :  {0}".format(div_content)) #div content
print("style_content :  {0}".format(div_content.get("style"))) # style attribute
print("class_content :  {0}".format(div_content.get("class")[0])) # class attribute

вывод:

div_content   :  {u'style': u'visibility: visible', u'class': [u'title']}
style_content :  visibility: visible
class_content :  title

Красивые атрибуты тега извлечения Супа, затем find_all с несколькими атрибутами

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

код:

вывод:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Красивые атрибуты тега извлечения Супа, затем find_all с несколькими атрибутами

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

1 Ответ

код:

вывод:

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов