Question

Это мой HTML тег. Я пытаюсь получить значение после тега <br>. Когда я пытаюсь сделать это, я получаю оба значения. Как бы я это сделал, используя Beautiful Soup. Любая помощь будет оценена.

<div class="col search_price discounted responsive_secondrow">
<span style="color: #888888;"><strike>CDN$ 2.29</strike></span>
<br>CDN$ 1.48
</div>

dabingsou · Answer 1 · 21 января 2020

Другие решения.

from simplified_scrapy.simplified_doc import SimplifiedDoc
html='''
<div class="col search_price discounted responsive_secondrow">
<span style="color: #888888;"><strike>CDN$ 2.29</strike></span>
<br>CDN$ 1.48
</div>
'''
doc = SimplifiedDoc(html)
divs = doc.getElementsByClass('col search_price discounted responsive_secondrow')
for div in divs:
  value = div.br.nextText() # first
  print (value)
  value = doc.html[div.br._end:div._end-6] # second
  print (value)
  value = doc.removeHtml(div.getSectionByReg('<br.*>.*')) # third
  print (value)
  value = div.removeElement('span') # fourth
  print (value.text)

Результат:

CDN$ 1.48
CDN$ 1.48
CDN$ 1.48
CDN$ 1.48

spacecowboy · Answer 2 · 19 января 2020

У вас, по сути, было это, просто нужно было использовать словарь attrs для правильного класса div, а затем искать следующий тег 'br', чей брат - ваш текст:

from bs4 import BeautifulSoup as bs
HTML = """
<div class="col search_price discounted responsive_secondrow">
<span style="color: #888888;"><strike>CDN$ 2.29</strike></span>
<br>CDN$ 1.48
</div>
"""
soup = bs(HTML, 'html.parser')
# get all divs with your class attr
divs = soup.find_all("div", attrs={'class': 'col search_price discounted responsive_secondrow'})
for div in divs:
    # find the <br> tag, next_sibling is the data
    print(div.find_next('br').next_sibling)

Как мне очистить этот тег от сети?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как мне очистить этот тег от сети?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов