Особый элемент класса в прекрасном супе - PullRequest
0 голосов
/ 25 января 2019

у меня есть текст ниже html <div class="jtxt" title="abcd"></div> <div class="jtxt orange"> <span>Confidential</span>
'я хочу напечатать только abcd, т.е. часть class = jtxt и не включать jtxt jco, когда я печатаю a.findAll("div",{"class":"jtxt"}) весь заголовок печатается.я не хочу никакого ограничения, основанного на индексе, где это печатается.Есть ли способ ограничить class="jtxt", не содержащий "jtxt".
Я делаю код выше в Python, используя красивый суп

Ответы [ 2 ]

0 голосов
/ 25 января 2019
import bs4

html = '''<div class="jtxt" title="abcd"></div> <div class="jtxt orange">  <span>Confidential</span>'''

soup = bs4.BeautifulSoup(html, 'html.parser')

title = soup.find('div')['title']

print (title)

Выход:

'abcd'
0 голосов
/ 25 января 2019

Вы можете получить доступ к атрибутам тега, рассматривая тег как словарь. Подробнее об этом вы можете прочитать в документации .

from bs4 import BeautifulSoup
html="""
<div class="jtxt" title="abcd"></div> <div class="jtxt orange">  <span>Confidential</span>
"""
soup=BeautifulSoup(html,'html.parser')
print(soup.find('div',class_='jtxt')['title'])

выход

abcd
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...