Question

У меня есть следующий html код:

< div xmlns="http://www.w3.org/1999/xhtml" class="line">< span class="html-tag"> <Value> </span>< span class="text"> 14966.50</span> < span class="html-tag" ></Value>< /span ></div>

Как мне извлечь 14966.50?

dabingsou · Answer 1 · 13 февраля 2020

Если ваши теги HTML такие же грязные, как вы их положили, я предлагаю вам использовать эту библиотеку для их решения.

from simplified_scrapy import SimplifiedDoc
html = '''
<div xmlns="http://www.w3.org/1999/xhtml" class="line">
  <span class="html-tag">
    <Value>
      <span class="text"> 14966.50 <span class="html-tag">
    </Value>
      </span>
</div>
'''

doc = SimplifiedDoc(html)
text = doc.Value.text
print (text)

Результат ：

14966.50

Вы сначала можно получить div, затем Value.

doc = SimplifiedDoc(html)
text = doc.select('div.line>Value>text()')
print (text)

Вот пример SimplifiedDo c: https://github.com/yiyedata/simplified-scrapy-demo/tree/master/doc_examples

puhuk · Answer 2 · 13 февраля 2020

Вы можете использовать этот код

import requests
from bs4 import BeautifulSoup

req = requests.get('Your URL')
raw = req.text

html = BeautifulSoup(raw, 'html.parser')

infos = html.select('Value')
print(infos[0])

Как очистить текст во вложенном промежутке с помощью Beautifulsoup?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Как очистить текст во вложенном промежутке с помощью Beautifulsoup?

Пожалуйста, войдите или зарегистрируйтесь чтобы ответить на этот вопрос.

Ответы [ 2 ]

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Пожалуйста, войдите или зарегистрируйтесь что бы добавить комментарий.

Нет похожих вопросов