Соскоб информацию с Beautiful Soup в одноименных тегах - PullRequest
0 голосов
/ 15 октября 2018

Я хочу собрать информацию со страницы html с помощью Beautiful Soup в Python, и вся необходимая информация находится в одном теге имени> Как я могу выделить каждую нужную мне информацию?

enter image description here Вся необходимая информация находится в разных тегах class = "hAyfc".

1 Ответ

0 голосов
/ 16 октября 2018

Результат будет в порядке. Вам просто нужно вывести результат, потому что порядок результатов такой же, как в html

from bs4 import BeautifulSoup

html = """
<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeA
            </span>
        </div>
    </span>
</div>

<div class = "hAyfc">
    <div class = "BgcNfc">pro </div>
    <span class = "htlgb">
        <div>
            <span class = "htlgb">
                codeB
            </span>
        </div>
    </span>
</div>
"""

bs = BeautifulSoup(html,"lxml")
result = [e.text for e in bs.find_all("div",{"class":"hAyfc"})]
print(result)
Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...