Есть ли хороший способ объединить эти списки find_all в правильном порядке - PullRequest
0 голосов
/ 11 февраля 2019

Я собираю некоторые базовые данные с помощью Python и BeautifulSoup.У меня есть две переменные с данными, которые связаны между собой.Я могу красиво распечатать данные в собственном отчете о печати, разметив теги и отформатировав их.Я не могу понять, нужно ли мне умело комбинировать мой суп find_all или если мне нужно найти лучший способ объединить печать двух переменных.

Данные в основном результаты аукциона недвижимости.1 набор тегов под "div" это пригород и улица.Другой набор тегов в разделе «span» с другим «attrs =» - это цены.

Я пытался использовать + между запросами soup.find_all, но это было все первое + все последующее при печати, я пытался использовать "for child in results.descendants" и другие параметры со страниц документации BeautifulSoup.

Я попытался найти другой ответ о переполнении стека, который показывает, как я мог бы правильно комбинировать свои запросы .find_all, но проблема, с которой я столкнулся, заключалась в том, что тег div и тег span объединены (я полагаю), и я получил двойной печатный наборэлементов с тегами span, один красиво отформатированный и еще один в тегах span.

Код (отредактирован для комментария ниже):

    from bs4 import BeautifulSoup
    from urllib.request import urlopen

    # URL for scraping
    quote_page = 'https://www.allhomes.com.au/auction-results/'

    # query the website and return the html to the variable 'page'
    page = urlopen(quote_page)

    # parse the html using beautiful soup and store in variable `soup`
    soup = BeautifulSoup(page,'html.parser')

    # grab the data from the different places in the page
    sched_auctnum_and_clear_perc = soup.find_all("p", "allhomes-auction- 
    results__stats-item-value") # Headline numbers

    house_and_address = soup.find_all("div", ["allhomes-auction-results__listing-group-title",
                                     "allhomes-listing-card__auction-address"])

    prices = soup.find_all("span", attrs={"allhomes-listing-card__auction-price-main",
                                "allhomes-listing-card__auction-price-prefix"})


    for scheduled_percents in sched_auctnum_and_clear_perc:
        num_percent = scheduled_percents.contents[0]
        print(num_percent)

    for each_house_result in prices:
        results_or_price = each_house_result.contents[0]
        print(results_or_price)

    for houses_results in house_and_address:
        street_address = houses_results.contents[0]
        print(street_address)

Как лучше всего комбинировать,дом и адрес переменной с ценой переменной.

Рад слышать ваш вклад!

Добро пожаловать на сайт PullRequest, где вы можете задавать вопросы и получать ответы от других членов сообщества.
...