Python Beautifulsoup4 извлечь специальные данные - PullRequest
0 голосов
/ 10 мая 2018

Привет, ребята. Я хочу извлечь некоторые данные, подобные этой, я использую python 3.6 и BeautifulSoup4, спасибо за вашу помощь:

from bs4 import BeautifulSoup

source = html_data = """
        <span class="some_data">
            title 1 : data 1
            <br/>
            title 2 : data 2
            <br/>
            title 3 : data 3
            <br/>
            <span class="meta_data">
                other additional data
            </span>
        </span>
    """

soup = BeautifulSoup(source, 'lxml')

data = soup.find("span", class_="some_data").text

print(data)

# how to get only this : title 1 : data 1 / title 2 : data 2  / title 3 : data 3
# without  :    <span class="meta_data">
#                   other additional data
#               </span>

1 Ответ

0 голосов
/ 12 мая 2018

спасибо, я решил мою проблему вот код:

from lxml.html import fromstring

source = fromstring(source)

result = source.xpath("//span[@class='some_data']/text()")

for i in result :
    print(i.strip())
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...